Seedance2 提示词工程

Prompts

Seedance2 视频生成提示词工程——多模态引用系统、电影级镜头语言、音画同步及分场景提示词模板,专为字节跳动 Seedance2 模型设计。

Install

openclaw skills install seedance-2-prompt

Seedance2 提示词工程技能

本技能由 coopeai.com 创制,为字节跳动 Seedance2 模型提供专业视频生成提示词指南,适用于影视短片创作者、品牌视频制作人和社交媒体内容设计师。


1. Seedance2 模型规格参考

1.1 模型变体

变体适用场景
Standard T2V文生视频,最高画质,完整场景生成
Standard I2V图生视频,首尾帧锁定,角色一致性保持
Standard Video Edit指定片段编辑——换角色、改动作、修改剧情
Standard Video Extend基于现有片段延伸连续镜头
Fast T2V / I2V / Edit / Extend相同能力,低延迟,适合实时工作流
Turbo 变体最低延迟,适合快速原型和迭代草稿

1.2 多模态输入限制

输入类型上限说明
图片最多 9 张角色参考、风格参考、首尾帧
视频最多 3 段,总时长 ≤15 秒运动方式、摄影机运动、剪辑节奏
音频最多 3 个 MP3,总时长 ≤15 秒背景音乐、音效、对白同步
文件总数每次生成 12 个优先选择影响最大的素材

1.3 输出规格

  • 时长: 4–15 秒(每次生成可自由选择)
  • 分辨率: 原生 480p 和 720p
  • 音频: 原生联合生成——音效、音乐和环境音直接内嵌输出,无需后期叠加
  • 架构: 双分支扩散 Transformer,视频与音频同步生成

1.4 内容限制

Seedance2 采用生成前拦截机制(而非事后过滤):

  • 不允许使用真实人物肖像(未授权)
  • 不允许使用受版权保护的角色或品牌标识
  • 不允许生成有害、欺骗性或危险内容
  • 所有输出携带 C2PA 水印,保障内容真实性

2. @ 提及系统——素材引用语法

@ 提及系统是 Seedance2 最核心的功能,让你明确指定每个上传素材在生成中承担的角色。

2.1 核心语法

@Image1、@Image2 … @Image9    — 上传的图片文件(按上传顺序编号)
@Video1、@Video2、@Video3     — 上传的视频片段
@Audio1、@Audio2、@Audio3     — 上传的音频文件

2.2 引用模式速查

目标提示词写法
锁定首帧以 @Image1 作为第一帧
锁定尾帧以 @Image2 作为最后一帧
复制摄影机运动完全参考 @Video1 的摄影机运动方式
复制动作编排参考 @Video1 的打斗动作编排
设定背景音乐使用 @Audio1 作为背景音乐
卡点剪辑将 @Image1 到 @Image6 剪辑到 @Video1 的音乐节拍上
换角色将 @Video1 中的女性替换为 @Image1
延伸片段将 @Video1 延伸 8 秒
应用鱼眼效果将 @Video1 的鱼眼镜头效果应用到新场景
组合地点+角色角色来自 @Image1,场景来自 @Image2,摄影机运动参考 @Video1

2.3 @ 提及使用规则

  1. 明确角色 — 始终说明每个素材的用途(风格、运动、角色、音频),避免歧义让模型自行猜测。
  2. 编号顺序 — @Image1 是第一个上传的文件,@Image2 是第二个,运行前务必核对顺序。
  3. 编辑 vs. 引用 — 修改片段时用"编辑 @Video1,将……改为……";仅作风格参考时用"参考 @Video1 的……风格"。
  4. 延伸时长匹配 — 延伸片段时,生成时长设为新增时长(如延伸 8 秒,就生成 8 秒,而非 15 秒)。

3. 提示词工程最佳实践

3.1 场景结构公式

按以下顺序书写提示词效果最佳:

[主体 + 动作] + [环境 + 氛围] + [摄影机语言] + [运动节奏] + [音频方向] + [时长提示]

3.2 摄影机语言词汇表

Seedance2 对专业电影摄影术语响应效果远好于模糊描述:

技法提示词关键词
缓慢推进缓慢向主体推进的移动镜头
环绕镜头围绕主体的环形弧形镜头
跟踪镜头跟随主体的连续运动镜头
希区柯克变焦主体受到惊吓时的希区柯克变焦
升降镜头镜头上升揭示天际线全景
手持镜头自然晃动的手持摄影
固定镜头静止锁定的广角镜头
斜角镜头轻微荷兰角,制造紧张感
第一人称视角第一人称主观视角镜头

3.3 运动与节奏描述符

节奏感提示词示例
缓慢优雅动作舒缓优雅,每一步都经过深思
能量充沛快节奏动感运动,高能量爆发
凝固瞬间时间凝固效果,主体悬停于半空
卡点节奏剪辑节点与 @Audio1 的鼓点同步
一镜到底一个连续跟踪镜头,全程无切换

3.4 打光与氛围

始终描述光源位置、方向和质感,而非仅描述情绪:

  • 好: "暖色黄金时刻阳光从左侧斜射,混凝土上投下长长的柔和阴影"
  • 差: "好的打光,温暖感觉"

常见打光方案:

视觉风格提示词
黄金时刻温暖的黄金时刻阳光,低角度入射,拉出长阴影
夜晚霓虹霓虹灯街道,青色与洋红倒映在湿润路面上
干净棚拍柔和的摄影棚柔光箱照明,中性背景,无阴影
强烈明暗对比高对比度卡拉瓦乔式布光,单硬主光,深重阴影
自然阴天柔和漫射的阴天自然光,均匀平整的照明

3.5 音频方向

Seedance2 原生生成音频,提示词中应包含音频意图:

  • "城市环境音,远处车流,微弱风声"
  • "配乐随镜头推进逐渐增强,紧张感上升"
  • "清脆的碎石踩踏声,无音乐,仅环境音"
  • "使用 @Audio1 作为配乐,剪辑节点与节拍同步"

4. 使用场景与提示词示例

场景一:电影感短片——单人物叙事

目标: 以角色为核心的叙事瞬间,强烈情感冲击。

提示词模板:

[角色描述] 正在 [动作],位于 [环境]。镜头 [摄影机运动],捕捉 [情感细节]。[打光方案]。[音频方向]。[时长]。

示例(回家):

一名疲惫的上班族穿着皱巴巴的西装,拖着公文包走进昏暗的公寓。镜头缓慢向他的面部推进,他听到下一个房间传来女儿的笑声——表情从疲惫变为温柔。暖色实用灯光,走廊深处充满阴影。环境音:吱呀作响的门声,远处孩子的笑声。8 秒。


场景二:卡点品牌视频——多图蒙太奇

目标: 将一组产品或生活方式图片剪辑到音乐节拍上。

提示词模板:

将 @Image1 至 @Image[N] 按顺序剪辑,节点对应 @Audio1 的关键帧和整体节奏。每张图保持 [X] 拍,然后 [转场方式]。[整体视觉氛围]。

示例(时装发布):

将 @Image1 至 @Image7 按顺序剪辑,节点对应 @Audio1 的鼓点。每张图保持 2 拍后硬切。服装之间的闪切,高对比度,强劲直射灯光。最后定格在 @Image7 上 1 秒。10 秒。


场景三:角色一致性——多镜头叙事

目标: 使用图片引用,在多个场景中保持角色形象一致。

提示词模板:

角色 @Image1 [场景一动作]。然后 [场景二动作]。最后 [场景三动作]。全程保持角色外貌一致。[摄影机风格]。[基调]。

示例:

角色 @Image1 在阳光明媚的卧室中醒来伸懒腰。然后走进厨房倒咖啡,瞥向窗外雨中的街道。最后坐在木桌前打开笔记本,嘴角浮现一丝微笑。全程保持温暖的晨光。自然晃动的手持摄影。亲密、静谧的基调。12 秒。


场景四:摄影机运动复制

目标: 将参考视频中的复杂摄影机编排应用到新场景。

提示词模板:

新场景:[描述主体和环境]。摄影机运动参考 @Video1——复现其 [具体技法]。[打光]。[音频]。

示例(希区柯克变焦):

一名女性站在一条狭长图书馆走廊的尽头。当她转身面向镜头时,复现 @Video1 的希区柯克变焦——背景急速退缩,她保持清晰对焦。冷白荧光灯,轻微绿色色调。诡异的环境嗡嗡声。6 秒。


场景五:视频延伸——连续场景发展

目标: 将现有片段延伸为更长的连续序列。

提示词模板:

将 @Video1 延伸 [X] 秒。从片段结束处继续:[描述下一个动作/事件]。保持 [打光/角色/环境] 的一致性。[如需调整,说明新的音频方向]。

示例:

将 @Video1 延伸 10 秒。从跑步者离开走廊处继续——她破门而出冲上屋顶,在边缘急刹车,眺望落日下的城市全景。保持手持摄影的能量感。从室内荧光灯切换到温暖的黄金时刻光线。@Audio1 的弦乐配乐持续升华。10 秒。


场景六:视频编辑——角色或动作替换

目标: 在保持其他元素不变的情况下,修改现有视频中的特定元素。

提示词模板:

编辑 @Video1:将 [原始元素] 替换为 [来自 @Image1 或描述的新元素]。保持 [其他所有元素] 完全不变。

示例:

编辑 @Video1:将走过桥上的男性替换为 @Image1(一名身穿红色大衣的女性)。桥的环境、打光、雨景和摄影机运动完全不变。她的行走节奏和步幅与原始人物保持一致。7 秒。


5. 多轮编辑指南

Seedance2 支持迭代式精修,使用以下模式进行多轮对话:

  1. 隔离修改内容:

    • 模糊: "让它更有电影感"
    • 精确: "保持主体和环境与生成结果完全一致。加入缓慢向主体面部推进的移动镜头,并将光线色调调整为更温暖的金色。"
  2. 调整节奏:

    • 模糊: "更慢一点"
    • 精确: "将整体运动速度降低大约一半。摄影机运动应缓入,而不是一开始就全速运动。"
  3. 音频调整:

    • 模糊: "换个更好的音乐"
    • 精确: "将背景配乐替换为 @Audio2。保留所有环境音效——只替换音乐层。"
  4. 选择性延伸:

    • 模糊: "让它更长"
    • 精确: "将 @Video1 延伸 6 秒。门关上后,在空荡的走廊中静止保持 2 秒,然后随着光线渐暗缓慢推向窗户。"
  5. 保持一致性:

    • 始终明确哪些元素必须保持不变:"保持角色外貌、房间打光和摄影机角度与 @Video1 完全一致。只将窗外可见的季节从夏天改为冬天。"