Install
openclaw skills install ai-voice-synthesis-clawAI智能配音合成专家。将文案/脚本转换为高拟真语音音频,支持多种音色、情感控制、SSML标注和后期处理。 触发场景:用户说"配音"、"语音合成"、"TTS"、"旁白"、"播客音频"、"有声读物"、"AI配音"、"朗读"、"音频生成", 或要求"用XX声音读这段文案"、"生成播客音频"、"把文章转成有声版"等。 支持 ElevenLabs、OpenAI TTS、Azure TTS 等引擎,输出 MP3/WAV 格式音频文件。
openclaw skills install ai-voice-synthesis-claw将文字转化为有温度的声音。
收集以下信息(未提供时使用默认值):
references/voice-style-guide.md 选择合适音色在调用 TTS 前对文本进行处理:
按优先级选择可用引擎:
ELEVENLABS_API_KEYOPENAI_API_KEYAZURE_SPEECH_KEY + AZURE_SPEECH_REGIONtts 工具直接合成(无需 API key,质量较低)检查环境变量确认可用引擎:
echo "ElevenLabs: $ELEVENLABS_API_KEY" && echo "OpenAI: $OPENAI_API_KEY"
参考 references/ssml-guide.md 为文本添加 SSML 标注。
简单场景可跳过,直接传纯文本。
# 单段文本合成
python3 scripts/synthesize-voice.py \
--text "你好,欢迎收听本期节目" \
--voice warm-female \
--speed normal \
--output ./output.mp3
# 从文件合成
python3 scripts/synthesize-voice.py \
--script ./script.txt \
--voice professional-male \
--speed fast \
--output ./output.mp3
# 添加背景音乐
python3 scripts/synthesize-voice.py \
--script ./script.txt \
--bgm ./bgm/light-jazz.mp3 \
--bgm-volume 0.1 \
--output ./output.mp3
参考 references/audio-processing-guide.md,脚本自动完成:
将生成的音频文件发送给用户:
合成完成!这是你的配音文件。
MEDIA:./output.mp3
| 场景 | 推荐音色 |
|---|---|
| 知识科普 | professional-male / professional-female |
| 情感故事 | warm-female |
| 商业广告 | magnetic-male |
| 轻松娱乐 | young-energetic |
详细音色库见 references/voice-style-guide.md。
pip install elevenlabs openai pydub requests
brew install ffmpeg # macOS
tts 工具