article-to-science-video

Other

将文章、论文、报告等文本内容自动转换为科普视频脚本的完整工作流。整合文章解析、脚本生成、分镜设计三步,支持短视频(抖音/TikTok 30-60s)和长视频(B站知识区 8-15min)两种模式,提供真人出镜和纯AI制作两种分镜方案。输出包含视频脚本、逐镜分镜表、画面提示词、字幕标注、剪辑指南,供用户在剪映等工具中自行合成。当用户说'把这篇文章做成科普视频脚本'、'将文章转为视频脚本'、'基于这篇文章生成视频脚本'、'文章生成视频脚本'等需求时触发。

Install

openclaw skills install article-to-science-video

Article to Science Video — 文章转科普视频脚本工作流

将任意文章/论文/报告自动转化为完整科普视频脚本的三步工作流:文章解析 → 视频脚本 → 分镜设计。

本工作流只生成视频脚本和分镜方案,不生成实际的视频/图片/音频素材。用户可根据脚本自行在剪映等工具中完成最终合成。

支持两种制作模式:

  • 真人出镜模式:真人讲解为主,画面提示词侧重辅助素材
  • 纯AI制作模式:无真人出镜,画面提示词侧重信息可视化(图形/表格/动画)

Quick Start

用户只需提供:

  1. 文章来源:文章链接、本地文件路径,或粘贴文章内容
  2. 视频平台:短视频(抖音/TikTok/视频号)或长视频(B站知识区/科技区)
  3. 制作模式(可选):真人出镜(默认)或纯AI制作
  4. 目标时长(可选):短视频默认 45s,B站长视频默认 10min

若用户要求"不用真人"、"AI配音"、"不要实拍"、"纯动画/图表"等,自动切换为纯AI制作模式


制作模式选择

在 Phase 2 开始前,确认用户的制作模式偏好:

模式特点适用场景画面构成建议
真人出镜(默认)真人讲解 + 辅助素材需要人设/IP/信任感主讲人 60% + 信息可视化 40%
纯AI制作纯信息可视化 + AI配音追求效率/无人设需求信息可视化 100%(动画/图表/图形)

纯AI模式触发条件:用户提及"不要真人"、"AI配音"、"不用出镜"、"纯动画"、"图表视频"、"信息可视化"等。

纯AI制作模式要点

  • 配音:建议使用 AI TTS 生成旁白,替代真人录音
  • 画面:以信息可视化为主,包括:
    • 动态信息图表(数据可视化动画)
    • 3D概念演示/过程动画
    • 科学示意图(细胞/大脑/分子等)
    • 抽象几何动画表达概念
    • 纯文字排版动画(大字报风格)
  • 无真人元素:画面中不出现任何真人面部/身体/手势

Phase 1: 文章解析 — 提取核心知识点

1.1 读取文章内容

根据用户提供的方式选择读取方法:

输入方式读取方法
文章链接使用 browser_visit 打开并提取正文
本地文件使用 read_file 读取(支持 PDF/Word/Markdown/TXT)
直接粘贴直接使用用户提供的内容

1.2 内容提取与结构化

对文章内容进行深度解析,提取以下要素:

📋 文章解析报告

- 文章标题:[原标题]
- 核心主题:[一句话概括]
- 目标受众:[适合的知识水平群体]
- 核心知识点(3-7个):
  1. [知识点1] — [一句话解释]
  2. [知识点2] — [一句话解释]
  ...
- 关键数据/案例:[列出文章中可视觉化的数据或案例]
- 有趣冷知识/反常识点:[适合作为 Hook 的亮点]
- 难度评级:[简单/中等/硬核]

提取原则

  • 保留专业准确性,但将术语转化为通俗表达
  • 识别最适合视觉化的内容(数据、流程、对比、现象)
  • 标记情感共鸣点(好奇心、惊讶感、危机感)
  • 短视频保留 1-2个 核心知识点,长视频保留 3-5个

Phase 2: 视频策划 — 平台选择与脚本生成

2.1 平台选择

根据用户需求确定输出格式:

平台时长触发词参考模板
短视频30-60s抖音、TikTok、视频号、短视频references/short-video-template.md
长视频8-15minB站、知识区、科技区、长视频references/bili-long-video-template.md

如果用户未指定,询问其目标平台。若用户不确定,默认推荐短视频模式。

2.2 生成视频脚本

读取对应参考模板后,按模板结构生成完整脚本。脚本必须基于 Phase 1 提取的核心知识点,不能脱离原文内容凭空创作。

脚本生成原则

  • 短视频:单点突破,一个核心知识点讲透,追求"啊哈"时刻
  • 长视频:体系化梳理,3-5个知识点递进,追求"看完就懂"的满足感
  • 所有口播文案必须标注预估时长,总时长误差控制在 ±10% 以内
  • 中文口播语速:正常 4-5字/秒,快速 5-7字/秒,慢速 3-4字/秒

Phase 3: 分镜设计 — 逐镜画面规划与提示词

3.1 生成分镜表

基于脚本,为每个镜头生成详细分镜描述。分镜表必须包含:

字段说明
镜号镜头序号
时间起止时间区间
段落Hook/铺垫/知识点/高潮/CTA
景别特写/近景/中景/全景
画面内容详细画面描述
配音文案对应口播文字
字幕标注需显示的字幕内容
画面提示词用于后续素材制作的英文描述

分镜设计原则

  • Hook 镜头:视觉冲击或概念动画特写,前3秒必须有强吸引力
  • 知识讲解镜头:数据可视化、动画演示、图文排版
  • 过渡镜头:平滑转场,保持节奏感
  • 结尾镜头:总结画面 + 互动引导元素

纯AI模式分镜原则

  • 信息可视化为核心:动态图表、3D演示、概念动画、数据可视化
  • 禁止出现任何真人形象:无面部、无身体、无手势
  • 每个镜头必须配有英文画面生成提示词,供用户后续生成素材时参考

3.2 素材建议(不实际生成)

根据分镜表,为每个镜头提供素材获取建议:

素材类型获取方式适用场景
动态视频AI文生视频工具(如可灵、即梦、Vidu等)粒子动画、流体运动、过程演示
静态图片AI文生图工具(如 Midjourney、即梦等)数据图表、概念图解、封面
网络素材免费图库(Unsplash、Pexels、Pixabay)真实照片、场景图片
配音音频AI TTS 工具(如 ElevenLabs、剪映朗读)旁白配音

画面提示词撰写规范

  • 使用英文描述,包含:主体、动作、场景、风格、镜头角度
  • 科普视频风格:干净、明亮、教育感
  • 纯AI模式:不含任何人物面部/身体,以物体、图表、粒子、几何图形为主
  • 示例:Abstract particle animation forming human brain connections, neural network visualization, blue and white color scheme, clean scientific aesthetic, smooth fluid motion, educational documentary style

3.3 输出完整脚本包

将以下所有内容打包输出(不含实际素材文件):

📦 科普视频脚本包
├── 📄 01-文章解析报告.md
├── 📄 02-视频脚本.md(完整脚本含时长标注)
└── 📝 03-制作备忘.md
    ├── 分镜表(逐镜分镜 + 画面提示词)
    ├── 字幕标注(时间点/内容/样式)
    ├── 素材获取建议(各镜头推荐获取方式)
    ├── BGM分段推荐
    ├── 配音文案汇总
    └── 剪映合成指南

Phase 4: 后期合成参考(用户自行完成)

脚本包中包含剪映合成参考指南,用户可根据此指南在剪映(CapCut)中完成最终视频。详见 references/post-production-guide.md


输出规范

脚本必须包含

  • 每段口播标注时间区间和预估字数
  • Hook 文案在前3秒内完成(≤20字)
  • 核心知识点与原文一致,不虚构数据
  • CTA 有明确的行动指令

分镜表必须包含

  • 每个镜头标注景别(特写/近景/中景/全景)
  • 每个镜头配有英文画面生成提示词
  • 每个镜头标注推荐素材获取方式
  • 总时长与目标时长误差 ≤10%
  • 镜号连续、时间无重叠

制作备忘必须包含

  • 完整分镜表(含时间、画面描述、提示词、素材建议)
  • 字幕标注(时间点/内容/样式建议)
  • 配音文案汇总(可直接复制用于TTS生成)
  • BGM分段推荐(风格/情绪/搜索关键词)
  • 剪映合成简要步骤

参考文件导航

文件内容何时读取
references/short-video-template.md短视频(30-60s)完整脚本模板、分镜表模板、黄金结构说明用户选择短视频平台时
references/bili-long-video-template.mdB站长视频(8-15min)完整大纲模板、弹幕设计、三连引导用户选择B站长视频时
references/shot-list-guide.md分镜设计指南、景别说明、画面提示词撰写规范、素材类型建议Phase 3 设计分镜时
references/post-production-guide.md剪映(CapCut)合成操作指南、字幕样式模板、BGM推荐库、导出设置制作备忘中引用