Install
openclaw skills install novel-to-audiobook-hznuyx17将小说章节转换为有声书(MP3)。当用户提到:转有声书、生成有声书、做成音频、听书、朗读章节、语音版时使用。自动分析章节内容,识别对话角色并分配不同音色,生成带背景音乐的完整有声书。
openclaw skills install novel-to-audiobook-hznuyx17路径说明: 所有脚本路径相对于此 Skill 目录。 执行时:
cd {skill_dir} && python scripts/...
收到用户请求后,按以下步骤执行:
从用户输入中获取章节文本:
第一章.md、第一章.txt)同时询问用户是否需要调整:
调用 DeepSeek 分析章节文本,识别旁白和对话:
python scripts/chapter_analyzer.py --file "章节文件路径" > temp_analysis.json
输出为 JSON,包含 segments 数组,每段有:
type: title / narration / dialoguetext: 分段文本character: 角色名(对话时)mood: 段落情绪同时获得统计信息: 总字数、对话占比、角色列表。
注意: 将输出保存为临时 JSON 文件,供后续步骤使用。
根据章节情绪生成纯音乐背景:
python scripts/music_generator.py \
--mood "章节情绪(如悬疑/温馨/平静)" \
--output "temp_bgm/bg_music.mp3"
情绪映射参考:
| 章节氛围 | 音乐风格 |
|---|---|
| 平静/日常 | 轻钢琴 |
| 悬疑/紧张 | 暗黑氛围 |
| 悲伤 | 钢琴独奏 |
| 欢快 | 轻快节奏 |
| 热血/战斗 | 管弦乐激昂 |
如用户不需要背景音乐,跳过此步。
根据分段结果,调用 MiniMax TTS 为每段生成语音:
python scripts/tts_generator.py \
--segments-file "temp_analysis.json" \
--output-dir "temp_audio/" > temp_tts_result.json
音色分配规则:
chapter_intro_voice)narration_voice)config.json 的 character_voices 中自定义拼接所有语音段 + 混入背景音乐:
python scripts/audio_assembler.py \
--segments "temp_tts_result.json" \
--bg-music "temp_bgm/bg_music.mp3" \
--output "E:/qwenpaw/Novel/有声书输出/小说名_章节名.mp3"
如没有背景音乐,去掉 --bg-music 参数。
将最终 MP3 文件路径和信息展示给用户:
在 config.json 中配置以下信息:
| 配置项 | 说明 |
|---|---|
deepseek_api_key | DeepSeek API Key(分析章节文本) |
minimax_api_key | MiniMax API Key(TTS + 音乐生成) |
tts_model | TTS 模型(默认 speech-2.8-hd) |
music_model | 音乐模型(默认 music-2.6-free) |
narration_voice | 旁白音色 |
default_male_voice | 男性角色默认音色 |
default_female_voice | 女性角色默认音色 |
output_path | 有声书输出目录 |
bg_music_volume | 背景音乐音量 (0.0~1.0,默认 0.15) |
示例 1: 用户提供文件路径
用户: 帮我把第一章转成有声书,文件在 E:\qwenpaw\Novel\当前作品\第一章.md
执行流程:
python scripts/chapter_analyzer.py --file "E:/qwenpaw/Novel/当前作品/第一章.md" > temp_analysis.json
python scripts/music_generator.py --mood "平静" --output "temp_bgm/bg_music.mp3"
python scripts/tts_generator.py --segments-file temp_analysis.json --output-dir temp_audio/ > temp_tts_result.json
python scripts/audio_assembler.py --segments temp_tts_result.json --bg-music temp_bgm/bg_music.mp3 --output "E:/qwenpaw/Novel/有声书输出/当前作品_第一章.mp3"
示例 2: 用户直接粘贴章节文本
用户: 这段转有声书:(粘贴文本内容)
用 --text 参数直接传文本:
python scripts/chapter_analyzer.py --text "粘贴的章节内容" > temp_analysis.json
character_voices 字段中自定义映射music-2.6-free 免费模型,如需更高品质可改为 music-2.6(需付费)temp_audio/ 和 temp_bgm/ 目录,可手动清理