Install
openclaw skills install whisper-transcribe-summarize本地 Whisper 语音转文字,自动生成清理文本、书面整理稿和结构化总结稿。支持音频和视频输入,全程离线。
openclaw skills install whisper-transcribe-summarize本地语音转文字 + 文本清理 + 整理稿 + 总结稿。全程离线,不依赖外部接口。
scripts/download_whisper_model.py — 模型下载scripts/local_whisper_transcribe.py — 转录python3ffmpegopenai-whisper(未安装时执行 python3 -m pip install -U openai-whisper)python3 scripts/download_whisper_model.py medium
可选模型:tiny / base / small / medium / large
推荐:中文用 medium,追求速度用 base 或 small。模型下载到 ~/.cache/whisper。
python3 scripts/local_whisper_transcribe.py "/路径/文件.mp4"
python3 scripts/local_whisper_transcribe.py "/路径/文件.mp3" --model medium
python3 scripts/local_whisper_transcribe.py "/路径/文件.mp3" --output "/路径/结果.txt"
支持音频和视频输入,视频通过 ffmpeg 自动提取音频。
默认输出 <源文件名>_whisper.txt,指定 --output 可自定义路径。
原始转录往往是繁体、无标点、有重复的粗糙文本,需要进行以下清理:
清理后覆盖保存到 <源文件名>_whisper.txt。
默认文件名:<源文件名>_整理稿.txt
整理稿不是逐句清理,而是将口语转录完全重写为流畅的书面文章。
默认文件名:<源文件名>_总结稿.md + <源文件名>_总结稿.html
在整理稿基础上生成结构化摘要,同时输出浏览器可直接查看的 html 版本。
### 第X部分 | 标题 格式# 标题
> **一句话概括**:全文主题
---
## 核心摘要
- **要点一**:结论
- **要点二**:结论
---
## 结构拆解
### 第一部分 | 标题
- **关键点**加粗,其余正常
---
## 关键观点
### 1. 观点标题
简洁解释,**核心结论加粗**。
---
## 原文摘录
> 原文片段,**关键词加粗**
用 Python markdown 库将 .md 转为带样式的 .html:
执行完成后只报告:
用户:帮我把 whisper medium 模型下到本地
→ 执行 scripts/download_whisper_model.py medium
用户:用本地 whisper 把这个 mp4 转成文字
→ 执行 scripts/local_whisper_transcribe.py,返回转录路径