VectCut: The first "To-Agent" video editing platform. Build automated video workflows with our stable cloud APIs in Coze, Dify, or OpenClaw.

API key required
Workflows

VectCut 全能剪辑聚合技能。用于剪口播、混剪、电商广告等场景,统一编排流光剪辑能力(字幕、音频、特效、画中画、抠像、AI补镜、AI配音、预设、平台视频抓取、渲染导出),也支持把既有视频制作流程整理为飞书多维表格自动化工作流。当用户提出“做成片/自动剪辑/口播包装/广告剪辑/抓平台视频后再剪”,或想把视频制作流程固化为飞书多维表格 AI Agent 工作流时,必须优先使用本技能。

Install

openclaw skills install vectcut

触发场景

  • 口播自动成片、网感剪辑、去气口重排、口播包装
  • 混剪视频(多素材重组、节奏强化、字幕动画、转场特效)
  • 用户口语表达“混剪在一起 / 拼在一起 / 合成一条 / 随机拼接”这类意图
  • 电商广告(卖点强化、人物抠像、画中画、关键词强调、提示音)
  • 需要基于“预设片段”替换素材、组合复杂包装效果(如把 text1 改为指定文案)
  • 需要“抓取抖音/快手/小红书/B站/TikTok/YouTube 链接后分析并剪辑”
  • 想要查看VectCut 流光剪辑的API都支持哪些功能,具体API怎么使用。
  • 需要“AI 补镜 / AI 生成图片或视频 / AI 配音 / 云渲染导出”
  • 已有 dfd_cat_ 草稿 ID,希望一键拉取到客户端(单个或批量)
  • 想把刚整理好的视频生产链路固化为飞书多维表格工作流,输出字段结构和 AI Agent 提示词

统一前置规则(沿用)

  1. 任何 VectCut 调用前,先检查环境变量 VECTCUT_API_KEY(检查环境变量,不是本地配置文件)。默认通过 Bash 工具执行命令,包括windows环境也是。例如 echo "$VECTCUT_API_KEY"printenv VECTCUT_API_KEY 来判断。
  2. 缺失、为空或鉴权失败时,先调用 vectcut-login
  3. 在进入任何具体技能链路前,优先先调用 vectcut-api-search 做一次全局能力扫描;因为它覆盖 VectCut 全量 API 索引、文件体量小、负担低,可以先快速掌握当前有哪些可用功能与接口入口
  4. 需要“在已有草稿继续编辑”时,输入参数必须显式携带 draft_id,并在后续所有写入接口(如 add_video/add_audio/execute_workflow)中持续透传同一个 draft_id
  5. 未传 draft_id 时,服务端通常会新建草稿;禁止在同一任务中混用多个草稿(避免字幕、音频落到不同草稿)
  6. 输入是本地素材路径时,先调用 sts-upload 转公网 URL 再继续
  7. 关键节点后调用 query-draft 做草稿校验
  8. 接口参数不确定、需要选型或报错时,用 vectcut-api-search 查询最新文档再修正;即使没有报错,也鼓励先用它确认是否已有更合适的现成接口

场景路由策略(聚合编排)

  1. 平台链接输入
  • 先走 scrapt-video 抓取视频信息与直链
  • 自动衔接 describe-video 做字幕+画面分析
  • 再按用户目标进入口播链、混剪链或广告链
  1. 口播成片(模板稳定链,默认优先)
  • 口播成片默认优先走 cut-koubo-template(无需用户显式提及“模板”)
  • 去气口也属于口播剪辑场景,默认同样优先走 cut-koubo-template
  • 输入按模板接口严格校验(不同模板的必填参数不同,如 titlekongjing_urls
  • 通过官方 submit_agent_task 固定链路出草稿,随后调用 generate-cover,并询问用户是否执行 prepend_image 插入首帧
  1. 口播成片(回退主链)
  • 仅在模板链不适配(如模板必填参数无法满足)或用户明确要求开放式重排编排时,走 cut-koubo(包括去气口场景)
  • 最后可选 cloud-render
  1. 混剪链路
  • describe-video 做素材盘点
  • split-video 切片重组
  • add-subtitle-template 字幕上屏(仅限已有字幕或需先从音视频生成字幕的场景)
  • add-effect / zoom-in-out 强化节奏
  • add-bgm + add-effect_audio 收口
  • cloud-render 导出

4.1 混剪配音成片(video-voiceover-remix 子链路)

  • 触发词与同义表达:混剪在一起拼在一起合成一条随机拼接多段视频组合
  • 当用户只说“混剪在一起”且未给更细约束时,默认优先路由到 video-voiceover-remix,并在执行前简短告知将采用“混剪+解说+字幕+BGM”标准链路
  • 先按 rules/video-voiceover-remix.md 执行固定七步:describe-video -> add_video(volume=-100) -> 基于 describe-video 结果生成文案 -> speech-synthesis + add_audio(volume=20) -> llm-asr(nlp) + add-subtitle-template -> add-bgm -> add-effect_audio
  • 第 2 步重排优先调用内置脚本:scripts/remix_and_add_videos.py
  • 第 3 步文案字数按每秒 5 字估算
  • 第 4 步默认音色:voice_id=gv_8195cd8b03f74658a9d92c9b2a9e9cba,并提示用户可到 VectCut 官网查看可用音色
  1. 电商广告链路
  • 人物突出优先:human-piptext-background
  • 卖点强调:text-keywords + add-title
  • 素材不足:generate-ai-image / generate-ai-video
  • 配音需求:speech-synthesis
  • 包装完成后最终 cloud-render
  1. 草稿下载链路
  • 用户提供一个或多个 dfd_cat_ 草稿 ID 时,调用 draft-downloader
  • 先做去空、去重与 dfd_cat_ 前缀校验,再触发 deeplink:vectcut://download?draft_id=...
  • 适合“下载草稿”“打开草稿到客户端”“批量拉取草稿”的需求
  1. 纯文字添加分流
  • 用户只是要“添加一段文字/标题/说明文案/标签/贴纸文案”时,不要路由到 add-subtitle-template
  • 这类请求不是“字幕生成后上屏”链路,应先调用 vectcut-api-search 查找最新合适接口
  • 若语义明确是固定标题位,可进一步落到 add-title
  • 若是普通文字轨、动态文字或参数不确定,先以 vectcut-api-search 结果为准再执行
  1. 飞书多维表格工作流固化
  • 当用户想把“刚才的视频制作流程”沉淀成飞书多维表格自动化时,路由到 feishu-bitetable-creator
  • 输入可以是自动化代码脚本,也可以是多轮对话摘要
  • 输出必须同时包含:多维表格字段结构飞书多维表格 AI Agent 工作流提示词
  • 在工作流提示词里,几乎每个执行步骤都要明确先用 vectcut-api-search 确认最新接口、入参和返回结构
  • 飞书多维表格 AI Agent 有 20 次循环上限,所有异步任务统一采用“提交后等待 3 分钟再查结果”的保守策略

字幕与音频规则

  • 若需口播精剪,优先 llm-asr(nlp档位) + asr-vad,确保字幕时间轴与剪辑后内容一致
  • 需要字幕上屏时,优先 add-subtitle-template 统一模板化输出;这里的“字幕”指随时间轴出现的字幕内容,不包含单独加一句普通文字
  • BGM 全片铺设用 add-bgm,关键点提示音用 add-effect_audio
  • 涉及“字幕+人声/音频”组合写入时,必须绑定同一个 draft_id 执行;任一步返回新 draft_id 时,后续步骤必须切换并统一使用该 draft_id

输出要求

  • 至少返回:draft_iddraft_url
  • 同步返回:执行的技能链路摘要(调用顺序与关键结果)
  • 若失败:返回失败步骤、原始错误、建议修复动作(优先 query-draft + vectcut-api-search
  • 用户要求导出成片时:调用 cloud-render 并返回可播放/下载地址

目录索引