Install
openclaw skills install ppt-to-video将PPTX/PDF/HTML与背景材料自动匹配,生成1280×720分辨率、带有智能风格识别和口语化TTS的播报视频。
openclaw skills install ppt-to-video将演示文稿 + 背景材料 → 播报/汇报视频
PPT to Video - 专业演示视频生成工具,支持多种输入格式,自动适配内容风格。
核心流程:
PPTX/PDF/HTML + 背景材料 (MD/TXT)
↓
截图 → 风格分析 → TTS → 合成
↓
1024×720 播报视频 (H.264 + AAC)
核心特性:
--rate 参数覆盖# 方式 1: 指定输入目录(自动检测文件类型)
node /home/Vincent/.openclaw/workspace/skills/ppt-to-video/scripts/generate.js \
--input /path/to/input/dir
# 方式 2: 已匹配讲稿模式(推荐)
node /home/Vincent/.openclaw/workspace/skills/ppt-to-video/scripts/generate.js \
--slides presentation.pptx \
--script script_matched.md \
--output ./video/
# 方式 3: 背景材料 + 智能匹配
node /home/Vincent/.openclaw/workspace/skills/ppt-to-video/scripts/generate.js \
--slides presentation.pptx \
--material background.md \
--readme README.md \
--output ./video/
# 方式 4: 搜索 note 文件夹
node /home/Vincent/.openclaw/workspace/skills/ppt-to-video/scripts/generate.js \
--input /path/to/project/ \
--searchNotes /path/to/project/ \
--output ./video/
| 参数 | 必需 | 说明 | 默认值 |
|---|---|---|---|
--date | 否 | 日期标识(用于输出文件名) | 今天 |
--input | 条件 | 输入目录(自动扫描所有文件) | - |
--slides | 条件 | 演示文件路径(PPTX/PDF/HTML) | - |
--script | 条件 | 已匹配讲稿路径(MD) | - |
--material | 条件 | 背景材料路径(MD) | - |
--readme | 否 | PPT 说明文件路径(MD) | - |
--searchNotes | 否 | 搜索 note 文件夹 | - |
--output | 否 | 输出目录 | ~/wechat_articles/Video/ppt-<date>/ |
--rate | 否 | TTS 语速(如 "+25%") | +25% |
--keepTemp | 否 | 保留临时项目文件夹 | 删除 |
输入优先级:
--script 指定已匹配讲稿(最高优先级)--material + --readme 背景材料 + 智能匹配--slides 降级模式| 格式 | 支持 | 说明 |
|---|---|---|
| PPTX | ✅ | PowerPoint 演示文稿(推荐) |
| ✅ | PDF 文档 | |
| HTML | ⚠️ | 单页 HTML 幻灯片(简化支持) |
方式 A:背景材料带页面对齐标记(最高优先级)
## 第 1 页 封面
欢迎观看本次演示...
## 第 2 页 核心摘要
这里是核心摘要内容...
## 第 3 页 大模型动态
这里是技术详情...
方式 B:背景材料 + README.md(智能匹配,推荐)
背景材料 background.md:
## 智谱 GLM-5.1 发布
智谱 AI 正式发布 GLM-5.1,官方称是目前全球最强的开源模型...
## Kimi K2.5 登顶榜单
月之暗面 Kimi K2.5 上线不到 24 小时,登顶 LMarena 开源模型首位...
## 阿里云 CodingPlan
阿里云百炼推出 CodingPlan,四大开源模型自由切换...
PPT 说明 README.md:
## 第 1 页 封面
关键词:AI 每日洞察、2026-04-10、零壹情报
## 第 2 页 核心摘要
关键词:智谱 GLM-5.1、Kimi K2.5、AGI 突破
## 第 3 页 大模型动态
关键词:智谱 AI、GLM-5.1、SWE-bench、8 小时持续工作
## 第 4 页 中国厂商
关键词:阿里云、CodingPlan、MiniMax、OpenRouter
## 第 5 页 美国厂商
关键词:OpenAI、Anthropic、Google DeepMind、Genie 3
## 第 6 页 趋势洞察
关键词:开源模型、智能体、长程任务
智能匹配逻辑:
README.md 中每页的关键词优势:
技能自动根据内容风格选择音色:
| 风格 | 音色 | 语速 | 适用场景 |
|---|---|---|---|
| 新闻 | zh-CN-XiaoxiaoNeural | +25% | 新闻播报、日报 |
| 技术 | zh-CN-YunxiNeural | +25% | 技术讲解、汇报 |
| 政治 | zh-CN-YunjianNeural | +25% | 时事政治、国际形势 |
| 轻松 | zh-CN-XiaoyiNeural | +25% | 轻松内容、教育 |
语速配置:
+25%(所有页面)--rate 参数覆盖:如 --rate "+30%"| 属性 | 值 |
|---|---|
| 分辨率 | 1280×720 (标准 720p 16:9) |
| 视频编码 | H.264 (libx264) |
| 音频编码 | AAC (128kbps) |
| 帧率 | 10 fps(静态图片) |
| 格式 | MP4 (movflags +faststart) |
/home/Vincent/.openclaw/workspace/wechat_articles/Video/ppt-2026-04-09/
├── video_2026-04-09.mp4 # 最终视频
├── screenshots/ # 演示截图(PNG)
│ ├── 01-page.png
│ ├── 02-page.png
│ └── ...
├── audio/ # TTS 音频(MP3)
│ ├── audio_01.mp3
│ ├── audio_02.mp3
│ └── ...
├── clips/ # 视频片段(MP4)
│ ├── clip_01.mp4
│ ├── clip_02.mp4
│ └── ...
└── VIDEO_COMPLETE.md # 完成报告
# Node.js (v18+)
node --version
# edge-tts (Python TTS)
pip install edge-tts
edge-tts --version
# ffmpeg (视频合成)
ffmpeg -version
# LibreOffice (PPTX 截图)
libreoffice --version
# poppler-utils (PDF 截图)
pdftoppm -version
# ImageMagick (HTML 截图,可选)
convert -version
# 安装 edge-tts
pip install edge-tts
# 安装 LibreOffice
sudo apt-get install libreoffice
# 安装 poppler-utils
sudo apt-get install poppler-utils
# 安装 ffmpeg
sudo apt-get install ffmpeg
# 安装 ImageMagick
sudo apt-get install imagemagick
node generate.js \
--input /home/Vincent/.openclaw/workspace/wechat_articles/daily/2026-04-09/
node generate.js \
--slides /home/Vincent/.openclaw/workspace/wechat_articles/world_intel_brief/ppt_20260409/international_brief.pptx \
--material /home/Vincent/.openclaw/workspace/wechat_articles/world_intel_brief/ppt_20260409/script.md \
--output /home/Vincent/.openclaw/workspace/wechat_articles/world_intel_brief/video_20260409/
node generate.js \
--slides tech_presentation.pptx \
--material tech_background.md \
--output ./output/
技能根据关键词自动识别内容风格:
edge-tts 不支持特殊停顿标记,使用标点符号控制节奏:
,:短停顿。:正常停顿;:中等停顿——:强调停顿+25%(所有页面)--rate 参数覆盖:如 --rate "+30%"技能会自动检查:
错误: PPTX 截图失败
解决:
# 检查 LibreOffice
libreoffice --version
# 如果未安装
sudo apt-get install libreoffice
错误: edge-tts: command not found
解决:
pip install edge-tts
edge-tts --version
错误: ffmpeg: command not found
解决:
sudo apt-get install ffmpeg
ffmpeg -version
| 版本 | 日期 | 变更 |
|---|---|---|
| v1.4 | 2026-04-10 | ✅ 讲稿口语化重写(汇报/新闻风格)<br>✅ 句子长度优化(15-25 字/句)<br>✅ 连接词自动添加(先重点后事实) |
| v1.2 | 2026-04-10 | ✅ 新增 README.md 智能匹配功能<br>✅ 三级优先级策略(标记 > 智能匹配 > 机械分割)<br>✅ 输出匹配度报告(每页分数) |
| v1.1 | 2026-04-10 | ✅ 分辨率改为 1280×720(标准 16:9)<br>✅ 统一语速 +25%,删除封面/结尾特殊加速<br>✅ 强制页面对齐标记(## 第 X 页)<br>✅ 增加音画对齐验证报告 |
| v1.0 | 2026-04-09 | 初始版本 |
技能路径: /home/Vincent/.openclaw/workspace/skills/ppt-to-video/
核心脚本: scripts/generate.js