Install
openclaw skills install iflytek-asr使用科大讯飞 API 将音频/视频转换为文字。支持本地音频文件转录、YouTube 视频下载并转文字。适用于会议记录、视频字幕、语音笔记等场景。当用户需要语音转文字、音频转录、YouTube 视频转文字时触发。
openclaw skills install iflytek-asr使用科大讯飞语音识别 API 将音频文件转换为文本,支持中文方言识别。
XFYUN_APP_IDXFYUN_ACCESS_KEY_IDXFYUN_ACCESS_KEY_SECRET在 skill 目录下创建 .env 文件:
XFYUN_APP_ID=your_app_id
XFYUN_ACCESS_KEY_ID=your_access_key_id
XFYUN_ACCESS_KEY_SECRET=your_access_key_secret
pip3 install yt-dlp requests python-dotenv
python3 scripts/speech_to_text.py <音频文件路径> [输出文本路径]
示例:
python3 scripts/speech_to_text.py meeting.mp3
python3 scripts/speech_to_text.py recording.wav output.txt
python3 scripts/download_and_transcribe.py "YOUTUBE_URL" [保存目录]
示例:
python3 scripts/download_and_transcribe.py "https://www.youtube.com/watch?v=VIDEO_ID" ~/Downloads
python3 scripts/download_audio.py "YOUTUBE_URL" [保存目录]
| 特性 | 讯飞 ASR | Whisper |
|---|---|---|
| 成本 | API 配额(有免费额度) | 免费 |
| 离线 | ❌ 需要网络 | ✅ 本地运行 |
| 速度 | ⭐⭐⭐⭐⭐ 快 | ⭐⭐⭐ 较慢 |
| 中文准确率 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 标点符号 | ✅ 自动添加 | ❌ 无 |
| 方言支持 | ✅ 支持 | ⭐⭐ 一般 |
建议:
讯飞免费版:
iflytek-asr/
├── SKILL.md # 本文档
├── README.md # 详细说明
├── QUICKSTART.md # 快速开始
├── .env.example # 配置模板
├── requirements.txt # Python 依赖
└── scripts/
├── speech_to_text.py # 音频转文字
├── download_audio.py # YouTube 下载
└── download_and_transcribe.py # 下载+转文字
Q: 转录失败怎么办?
Q: 如何提高准确率?
MIT License