Install
openclaw skills install multi-role-tts-skillMulti-role audio generator skill v1.0.1 全家桶版 - Universal professional tool for creating dialogue audio with multiple character voices.
openclaw skills install multi-role-tts-skill多角色音频生成器全家桶版是一个通用、专业、中性的OpenClaw Skill,专门解决多角色对话音频生成的技术挑战。彻底清理了硬编码内容,提供纯净的专业工具。
# 安装Edge TTS
pip install edge-tts
# 安装ffmpeg (macOS)
brew install ffmpeg
# 安装ffmpeg (Ubuntu/Debian)
sudo apt install ffmpeg
# 1. 准备多角色脚本
# 创建脚本文件 dialogue.txt
# 格式:
# 【角色A】
# 角色A的对话内容
#
# 【角色B】
# 角色B的对话内容
# 2. 运行生成器
./scripts/multirole-generator.sh dialogue.txt
output/角色A_音频.mp3output/角色B_音频.mp3output/多角色对话_最终版.mp3output/空间版/ (带空间位置感的版本)multirole-tts-skill/
├── SKILL.md # 技能说明文档
├── README.md # 项目README
├── scripts/ # 核心脚本
│ ├── multirole-generator.sh # 主生成脚本
│ ├── parse-script.sh # 脚本解析器
│ ├── generate-audio.sh # 音频生成器
│ └── spatial-audio.sh # 空间音频处理器
├── examples/ # 示例文件
│ ├── simple-dialogue.txt # 简单对话示例
│ ├── three-characters.txt # 三角色示例
│ └── config-example.json # 配置示例
├── docs/ # 文档
│ ├── usage-guide.md # 使用指南
│ ├── best-practices.md # 最佳实践
│ └── troubleshooting.md # 故障排除
└── config/ # 配置文件
└── default-config.json # 默认配置
{
"角色A": {
"voice": "zh-CN-XiaoxiaoNeural",
"rate": "+10%",
"volume": "0dB"
},
"角色B": {
"voice": "zh-CN-XiaoyiNeural",
"rate": "+15%",
"volume": "0dB"
}
}
{
"spatial_positions": {
"角色A": "center",
"角色B": "left",
"角色C": "right"
}
}
{
"audio_quality": {
"bitrate": "192k",
"samplerate": "44100",
"channels": "stereo",
"normalization": true
}
}
【角色名】
角色的对话内容
可以有多行
【另一个角色】
另一个角色的对话内容
【花花】
宝贝,训练开始了。
今天只有我和小霞。
【小霞】
对,就我们两个。
更直接,更亲密。
【花花】
放松,完全信任我们。
【小霞】
我会一直引导你的心理。
=== 场景名 ===# 这是注释输入脚本 → 解析角色 → 生成各角色音频 → 添加空间感 → 合成最终音频
↓ ↓ ↓ ↓ ↓
dialogue.txt → 角色A/B内容 → A.mp3/B.mp3 → A空间.mp3 → final.mp3
# 批量处理多个脚本
./scripts/batch-process.sh scripts/*.txt
# 并行生成各角色音频(如果系统支持)
./scripts/parallel-generator.sh dialogue.txt
# 确保Python版本正确
python --version # 需要Python 3.7+
# 重新安装
pip uninstall edge-tts
pip install edge-tts --upgrade
# 检查ffmpeg安装
which ffmpeg
# 安装ffmpeg
# macOS: brew install ffmpeg
# Ubuntu: sudo apt install ffmpeg
# 启用详细日志
DEBUG=1 ./scripts/multirole-generator.sh dialogue.txt
# 保存中间文件
KEEP_INTERMEDIATE=1 ./scripts/multirole-generator.sh dialogue.txt
# 克隆仓库
git clone https://github.com/yourusername/multirole-tts-skill.git
# 安装开发依赖
cd multirole-tts-skill
pip install -r requirements-dev.txt
# 运行测试
./scripts/run-tests.sh
MIT License - 详见LICENSE文件
这个Skill的灵感来源于真实的用户需求和优化迭代经验。特别感谢那些提供宝贵反馈的用户,他们的需求驱动了这个项目的诞生和发展。
最后更新:2026年3月22日 版本:v1.0.0 状态:稳定可用 作者:迷人花花(基于真实需求开发)