Install
openclaw skills install lh-video-genGenerate vertical short videos (9:16) from a Markdown script. Parses script sections, generates TTS audio, renders subtitle cards, and composites into MP4 with FFmpeg.
openclaw skills install lh-video-gen从视频脚本 Markdown 文件一键生成竖版短视频(9:16)。
核心思路:以图定音
python3 generate.py script.md -o output.mp4
python3 generate.py script.md --images-dir ./my-slides -o output.mp4
图片命名规则:slide_01.png, slide_02.png...,与脚本分段一一对应。
python3 generate.py script.md --tts-command "my-tts {text} -o {output} -v {voice} -r {rate}"
占位符:{text} 口播文案、{output} 输出路径、{voice} 音色、{rate} 语速。
python3 generate.py <脚本路径> [选项]
选项:
-o, --output 输出 MP4 路径(默认:tmp/video-output.mp4)
-v, --voice TTS 音色(默认:zh-CN-YunxiNeural)
-r, --rate 语速(默认:+0%,如 +10%、-10%)
-w, --width 视频宽度(默认:1080)
--height 视频高度(默认:1920,9:16)
--images-dir 使用已有图片目录,跳过 Chrome 截图
--tts-command 自定义 TTS 命令模板(占位符:{text} {output} {voice} {rate})
--keep-temp 保留临时文件(图片、音频、片段)
--no-subs 不烧录字幕
brew install ffmpeg)--images-dir 时需要)
CHROME_PATH 环境变量指定以下 Skill 非必需,但搭配使用效果更佳:
../lh-edge-tts/scripts/tts_converter.py,或通过 EDGE_TTS_PATH 环境变量指定,或用 --tts-command 替换为任意 TTS 工具--images-dir 传入用 --- 分隔各段,每段包含 **口播**、**字幕**、**画面** 字段:
# 视频标题
---
## 开场
**画面**:场景描述
**口播**:TTS 配音文案
**字幕**:屏幕显示文字\n支持换行
---
## 结尾
**画面**:场景描述
**口播**:TTS 配音文案
**字幕**:屏幕显示文字
完整模板:templates/script-template.md
--images-dir 加载)