Install
openclaw skills install douyin-transcribe-fast抖音视频快速转文字(优化版)。用户发抖音链接,自动提取文案。 特点:本地 Whisper 转录,无需 API Key,零成本,高隐私。 触发词:抖音、转文字、提取文案、视频转录
openclaw skills install douyin-transcribe-fast本地 Whisper 转录,无需 API Key,零成本,高隐私。
使用前确保以下工具已安装:
python --version
ffmpeg -version
未安装?Windows: winget install Gyan.FFmpeg
pip install openai-whisper
用户发送抖音链接,如:
2.89 03/17 zTl:/ n@d.nq 真正赚钱的人到底怎么用 AI? https://v.douyin.com/D4SVbwCEY6g/
执行步骤:
使用 douyin-mcp 获取视频下载链接:
mcporter call douyin-mcp.parse_douyin_video_info share_link="<抖音链接>"
ffmpeg -i "<视频URL>" -vn -acodec pcm_s16le -ar 16000 -ac 1 "audio.wav" -y
whisper "audio.wav" --model tiny --language Chinese --output_format txt
💡 优化提示:
- 使用
tiny模型最快(适合短视频)- 使用
base模型平衡速度和质量- 使用
small模型质量最好(适合长视频)
读取生成的 txt 文件,返回给用户。
用户发送视频文件,直接执行步骤 3-4。
| 策略 | 效果 | 适用场景 |
|---|---|---|
| 只下载音频流 | 减少 90% 下载时间 | 所有视频 |
| 使用 tiny 模型 | CPU 转录 1-2 分钟 | 短视频 (<3分钟) |
| 使用 base 模型 | CPU 转录 3-5 分钟 | 中等视频 (3-10分钟) |
| 跳过视频下载 | 直接提取音频 URL | 网页版抖音 |
用户发送抖音链接
↓
提取 modal_id / 视频 URL(通过 douyin-mcp)
↓
下载音频流(ffmpeg,~1-5MB)
↓
本地 Whisper 转录(tiny/base/small 模型)
↓
返回中文文案
总耗时:
| 问题 | 原因 | 解决 |
|---|---|---|
| douyin-mcp 返回 403 | API Key 无效 | 检查 ~/.cursor/mcp.json 配置 |
| ffmpeg 未找到 | 未安装或不在 PATH | 安装 ffmpeg 并添加到环境变量 |
| whisper 未找到 | 未安装 | 运行 pip install openai-whisper |
| 转录质量差 | 模型太小或音频不清 | 改用 base/small 模型 |
| 转录速度慢 | CPU 性能不足 | 使用 tiny 模型或升级硬件 |
| 模型 | 速度 | 质量 | 显存/内存 | 推荐场景 |
|---|---|---|---|---|
| tiny | ⚡ 最快 | ⭐⭐ | ~1GB | 短视频、快速预览 |
| base | 🚀 快 | ⭐⭐⭐ | ~1GB | 日常使用 |
| small | 🚗 中等 | ⭐⭐⭐⭐ | ~2GB | 高质量需求 |
| medium | 🐢 慢 | ⭐⭐⭐⭐⭐ | ~5GB | 专业用途 |
$env:PATH = "C:\Users\<用户名>\AppData\Local\Programs\Python\Python311\Scripts;" +
"C:\ffmpeg\bin;" +
$env:PATH
# 下载音频
ffmpeg -i "<视频URL>" -vn -acodec pcm_s16le -ar 16000 -ac 1 "audio.wav" -y
# 转录(tiny 模型,最快)
whisper "audio.wav" --model tiny --language Chinese --output_format txt
# 转录(base 模型,平衡)
whisper "audio.wav" --model base --language Chinese --output_format txt
| 特性 | douyin-transcribe | douyin-transcribe-fast(本版) |
|---|---|---|
| 依赖 | Groq API Key | 无需 API Key |
| 费用 | 免费(Groq) | 完全免费 |
| 隐私 | 音频上传到 Groq | 完全本地 |
| 速度 | 3-5 秒 | 2-15 分钟(取决于视频长度) |
| 网络要求 | 需要网络 | 安装后离线可用 |
| 准确度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐(small模型) |
| 适用场景 | 快速转录、大量视频 | 隐私敏感、离线环境、零成本 |
优化版 Skill,让抖音文案提取更简单、更私密、更经济。