豆包创意设计

Other

当用户要求生成、编辑、改图、修图、重绘、文生图、图生图、扩图、换背景、换风格、局部替换、参考图衍生、系列延展或多比例适配商业创意图片时使用;触发任务包括做图、出图、生成图片、设计海报、主视觉/KV、Banner、封面、社媒配图、社媒长图、电商主图、详情页、产品图、Logo、IP角色、吉祥物、包装、品牌应用物料、活动物料、宣传册、落地页、知识科普海报、教学图、教材插图、课件配图、思维导图、知识图谱、流程图、数据图表、科学结构图、公式推导图、工程图纸、多资产视觉系统等图片设计场景。

Install

openclaw skills install doubao-creative-design

Doubao Creative Design

定位

本 skill 是统一图片创意设计主入口。它负责识别用户意图、判断澄清需求、选择文生图或图生图路径、维护核心资产一致性,并按产物类型读取对应 reference。

SKILL.md 只放通用规则和路由。产物细则必须按需读取 references/,不要一次性加载所有 ref。

总流程

  1. 判断任务是否属于图片生成、图片编辑、图片延展或视觉物料规划。
  2. 判断用户上传图、历史生成图或现有资产的角色:核心资产、参考风格、编辑对象、内容资料或普通素材。
  3. 判断是否属于接续创作;若用户提到“根据生成的”“基于刚才”“用上一张”“继续做”“延展上一版”等,优先判断是否应调用 image_edit,并先识别用户具体指向哪一张或哪几张历史生成图。
  4. 判断是否命中具体产物路由;命中后只读取对应 reference。
  5. 判断是否需要澄清。只问会显著影响结果的 1-3 个问题;信息足够时直接执行。
  6. 建立或锁定当前核心资产。后续延展默认基于核心资产调用 image_edit
  7. 为每张图写独立、完整、可视觉化的中文 prompt,并单独确定 ratio
  8. 调用可用图片工具;工具不可用时说明能力缺口,不假装已执行。
  9. 结果完成后只给必要反馈,不重复复述画面。

工具协议

以宿主环境真实可用工具为准。若工具字段与 ref 不一致,以本节为准。

  • image_gen:从 0 到 1 生成核心图或无参考图的新图。入参优先使用 promptratio
  • image_edit:基于用户上传图、历史图或已确认核心资产的 CDN URL 做编辑、延展、系列化。入参优先使用 image_reference_url_listpromptratio
  • 各 ref 中出现的 tool_modeasset_idvisible_textimage 数组、画幅:参考图片 ID 等字段只作为内部规划或旧版模板理解;最终工具调用必须统一映射为本节字段。
  • 如果实际工具只支持 width/height,先由 ratio 推导尺寸;不要把尺寸写入 prompt。
  • 如果实际工具只支持本地文件或 URL,按宿主工具要求传图;不要把文件路径、URL、模型名、seed、工具字段写进 prompt。
  • 图片分辨率目标不低于 2048;宿主工具上限更低时按工具上限执行并说明。

已有明确参考图、编辑对象或核心资产时,禁止用纯文生图替代图生图延展,除非用户明确要求重做且不保持一致。

产物路由

按“明确产物 > 当前多轮上下文 > 上传图角色 > 平台关键词 > 通用视觉任务”仲裁。命中具体产物时读取对应 ref;未命中品牌、电商、平台媒体等专门 ref 时,按通用创意图片任务执行,不强行路由到品牌方案。命中多个产物时,先做影响后续范围最大的核心资产,再做下游应用。

用户意图 / 关键词读取 ref / 执行方式
Logo、标志、图形标、字标、标准组合、横竖版、单色、小尺寸、favicon、Logo 升级、Logo 规范页references/brand-logo-system.md
IP、吉祥物、角色设定、三视图、设定卡、表情包、贴纸、服装版本、角色海报、周边、IP 与 Logo 组合references/brand-ip-character-system.md
包装、产品包装、礼盒、瓶标、罐体、袋型、盒型、刀模、包装纸、封签、吊牌、开箱、陈列、SKU 变体references/brand-packaging-system.md
品牌应用、主 KV、活动海报、传播封面、内容卡片、Banner、宣传册、折页、落地页、展会物料、易拉宝、门店、贴纸、周边references/brand-application-system.md
电商主图、车图、详情页、A+ 页、店招、促销图、卖点图、对比图、直播间背景、商品头图、咸鱼、闲鱼、淘宝、京东、拼多多、亚马逊、Amazon、独立站商品图references/ecommerce-design.md
知识科普海报、知识图、教育图、教学图、教材插图、课件配图、课件图优化、思维导图、知识图谱、流程图、逻辑关系图、科学结构图、数据图表、工程图纸、时空演化图、公式推导图、受力分析图、电路图、票据教学图、凭证教学图、UI教学说明图、知识图优化、知识图纠错、知识图重绘references/knowledge-education-visual.md
B站、抖音、快手、朋友圈、公众号、小红书、笔记、种草、OOTD、探店、H5、互动长页、视频封面、多平台社媒配图、社媒长图、长图文、横幅焦点图、宣传海报、平台传播图references/media-creative.md
非品牌方案相关的其它图片任务,例如通用插画、概念视觉、氛围图、头像、壁纸、场景图、单张创意海报、参考图改风格、扩图、换背景、局部替换、普通文生图 / 图生图不读取产物 ref,按主 SKILL.md 的通用图片生成 / 编辑规则执行

品牌任务链路

品牌任务先判断是否需要 Logo 或 IP 作为核心资产,再生产衍生物料。不要把单一非品牌图片任务误扩展为品牌方案。

  1. 若后续物料主要继承品牌识别、字标、图形标、品牌色或规范系统,先生成或确认 Logo 核心资产,并读取 references/brand-logo-system.md
  2. 若后续物料主要继承角色形象、吉祥物、表情、姿态、服装或角色周边,先生成或确认 IP 核心资产,并读取 references/brand-ip-character-system.md
  3. Logo 与 IP 同时存在时,按用户指定优先;未指定时,包装、品牌应用、电商和正式品牌传播以 Logo 为主核心资产,IP 为辅助参考;表情包、贴纸、角色海报、角色周边以 IP 为主核心资产,Logo 为辅助参考。
  4. 核心资产确认后,再按目标产物读取包装、品牌应用、电商或媒体 ref 做衍生。所有需要保持一致性的衍生默认使用 image_edit
  5. 若任务不涉及品牌资产、品牌系统或品牌物料,只是普通图片生成 / 编辑,停留在主 skill 通用流程,不读取品牌 refs。

路由冲突

  • 用户提及咸鱼、闲鱼、淘宝、京东、拼多多、亚马逊、Amazon、独立站等电商平台,或要求平台商品图参数、主图比例、A+ 页面、详情页屏次时,必须读取 references/ecommerce-design.md 查找平台参数和电商约束,不按通用视觉任务处理。
  • 用户要求讲清知识结构、教学逻辑、科学结构、数据关系、公式推导、流程步骤、知识科普海报、教材/课件配图、知识图纠错/重绘/优化时,读取 references/knowledge-education-visual.md;如果只是平台封面点击率、社媒传播包装或泛干货经验分享,且不要求知识准确性/教学结构,走 references/media-creative.md;如果重点是商品销售转化,走 references/ecommerce-design.md
  • “海报 / Banner / 封面 / 长图”如果强调活动品牌系统,走品牌应用;强调具体社媒平台、社媒长图、H5 或平台传播,走多平台媒体;强调商品销售转化,走电商。
  • “品牌小红书首图 / 品牌公众号头图 / 品牌活动海报 / 品牌 H5 / 品牌 Banner”等同时包含品牌和平台传播的任务:如果用户提供或要求沿用 Logo、品牌色、主 KV、包装、IP 或品牌系统,走 references/brand-application-system.md,只借用平台画幅、信息密度和阅读场景;如果没有品牌资产继承,核心是平台内容传播,走 references/media-creative.md
  • “包装应用 / 周边应用”如果核心是包装结构,走包装;如果核心是角色周边,走 IP;如果核心是品牌触点延展,走品牌应用。
  • “Logo + 包装 + 海报”这类多资产任务,先按品牌任务链路确认 Logo 或用户指定核心资产,再按包装、应用顺序延展。
  • “参考这张图继续做一套”优先识别参考图是 Logo、IP、包装、产品、主 KV 还是社媒成品,再路由。
  • “完整 VI / 品牌全案 / 品牌手册”不是单一产物任务;如果用户只给本 skill,可先澄清交付范围,不自动把单一 Logo 或包装扩展成全案。

接续创作引用规则

  • 用户提到“根据生成的 XXX”“基于刚才那张”“用上一版”“继续做”“延展这个结果”“把上一张改成”等接续创作意图时,优先判断是否应调用 image_edit,不要默认走 image_gen 重画。
  • 接续创作必须先解析指代:只把用户明确指向、或能根据最近轮次与主体匹配度可靠判断出的历史生成图 CDN URL 写入 image_reference_url_list;不得把上一轮所有生成图都作为参考图。
  • 若被指向的历史图是当前任务的主体、核心资产、风格锚点或版式基础,必须调用 image_edit 并传入对应 CDN URL。
  • 若历史图只提供灵感、不需要保持主体、资产或版式一致,需在内部明确“仅参考语义,不作为 edit 参考图”,此时可按新任务选择 image_gen
  • 多张历史图可被引用时,按用户指代、最近轮次、主体匹配度排序;仍无法确定具体引用对象时,先简短确认,避免传错参考图。

澄清规则

信息完整度看三项:主体是否明确、用途/产物是否明确、硬约束是否明确。满足两项即可行动。

各 ref 可以提出该产物的关键信息判断,但不能覆盖本节澄清上限。缺失信息会改变根本方向时才问;缺失但可通过品类、平台或上下文合理推断时,内部决策并继续执行。用户说“你来定”“随便”“直接做”时,不再追问。

需要澄清的典型情况:

  • “生成图片”“做海报”“设计 logo”“做商品图”等过宽请求。
  • 图片编辑边界不清,可能误改人物、产品、Logo、品牌文字、包装结构或构图。
  • 需要渲染日期、价格、折扣、功效百分比、排名、认证编号等数值,但用户未提供。
  • 电商、包装、Logo、IP 等产物的关键输入缺失到会改变根本方向。

澄清最多一轮,每次 1-3 个问题。用户说“你来定”时,按产物 ref 的默认策略执行,并把关键默认值写进内部计划。

张数策略

优先级:用户明确张数 > 产物 ref 张数策略 > 主 skill 默认张数。张数必须服务用户意图,不为显得完整而主动扩展。

  • 单点编辑、局部修改、换背景、换风格、扩图、修图、单张普通文生图:默认 1 张。
  • 用户要求多个方向、方案对比或多版选择:默认 2-3 张,每张方向必须有明显差异。
  • 用户要求系列、套图、多平台或多比例适配:默认 3-4 张,按平台、比例、用途或物料角色拆分。
  • 用户要求完整方案、系统或全案:先规划并确认张数,不直接按最大规模生成。
  • 命中 Logo、IP、包装、品牌应用、电商、媒体 ref 时,以对应 ref 的张数策略为准;多 ref 任务不把各 ref 默认张数相加。
  • 没有明确张数时,普通任务不默认超过 4 张;命中 media 的多页图文、社媒长图、H5 或跨平台分发时,可按内容结构规划更多张,不设置机械硬上限。若张数与一致性冲突,优先减少张数,保证核心资产一致。

核心资产规则

  • 硬规则:一旦存在当前核心资产(image_gen 生成的 CDN URL),所有衍生物料必须显式引用该核心资产 URL,调用 image_edit 传入 image_reference_url_list;禁止仅凭文字描述用 image_gen 重新生成相似版本。
  • 不存在 image_edit 不可用场景:宿主工具支持 CDN URL 传参,所有核心资产生成后均可直接用于延展,无需降级。
  • 场景一致性硬规则:在品牌、电商、IP、叙事场景中,只要用户要求保持 Logo、IP、人物、产品、包装、主 KV、画风、角色身份或前后镜头一致,必须基于当前核心资产的 CDN URL 调用 image_edit 生成。
  • 用户上传的 Logo、品牌图、产品图、包装图、IP、人物角色、主 KV 默认是当前核心资产,除非用户明确说“仅参考风格”。
  • 第一张新生成的 Logo、IP、包装、产品主图或主 KV 一旦作为后续基础使用,即升级为当前核心资产。
  • 任一时刻优先维护一个主核心资产;多参考图存在时,用 [img0][img1] 标明每张作用。
  • 后续延展必须保持核心资产的识别特征,不脱离重画。

生成前检查

调用图片工具前必须检查:

  1. 当前任务是否涉及一致性保持;若涉及,是否已锁定核心资产。
  2. 是否正确选择 image_genimage_edit;需要一致性的衍生物料必须使用 image_edit
  3. image_edit 的参考图是否正确:image_reference_url_list 是否包含当前核心资产 CDN URL,[img0][img1] 的角色是否和 prompt 描述一致。
  4. prompt 是否明确写出保留项、修改项、目标画面和用户意图;不能只写“参考原图”“保持一致”。

Prompt 总规则

最终 prompt 是传给图片工具的唯一画面描述,必须是一段连贯中文,不使用标签化字段,不写内部 skill 名称。

  • 文生图:补全主体、场景或平面载体、风格、色彩、构图、材质、文字和光影。
  • 图生图:少复述原图,多描述目标图;明确参考维度、修改维度、保留维度。
  • 平面设计类任务不要描述无关现实背景,除非目标本身是 mockup 或空间展示。
  • ratio 单独传入,不写进 prompt。
  • 画面文字必须是真实可渲染文案,并使用中文双引号包裹。
  • 禁止使用 XX某某标题文案待补充文字相关说明若干文字占位符 等让模型自由补字的表达。
  • 价格、日期、折扣、销量、功效百分比、排名、评分、认证编号和监管声明只能来自用户提供或已确认资产;未提供时不要编造。
  • 不直接使用第三方品牌、影视作品、受保护 IP 或在世艺术家姓名作为风格锚点;转化为通用风格语言。
  • 最终 prompt 中避免出现平台名和用途说明,如“小红书封面”“抖音风”“公众号首图”;转译为视觉风格、构图和信息密度。
  • 最终 prompt 中不得出现内部规划字段或工具字段,例如 tool_modeasset_idvisible_textimage_reference_url_list画幅:比例:参考图片 ID

复杂任务

满足任一条件即先给执行计划并等用户确认:

  • 需要一组有关联的图片。
  • 需要先生成核心资产,再基于它生成其他资产。
  • 需要在文生图与图生图之间切换。
  • IP 表情包、贴纸、表情状态图即使只输出 1 张,也属于 IP 一致性任务;若尚无 core-ip,必须先生成或确认核心 IP,再基于核心 IP 的 CDN URL 调用 image_edit 生成。
  • 套图、系列图、多图输出,或任一需要保持 Logo、IP、人物、产品、包装、主 KV、画风、角色身份一致的任务,均视为复杂任务。
  • 涉及多比例、多平台、多物料或多轮迭代。
  • 用户明确要求完整方案、套图、系统、全案。

计划中写清:路由到哪些 ref、核心资产顺序、每张图目的、是否需要用户补充关键文字或数值。

外部信息

只有用户明确要求最新资料、真实活动信息、外部品牌资料或公开平台规范时才检索外部资源。使用外部来源必须在回复中标注链接。已有参考图时,不用联网搜图替代图片理解。

生成后检查与反思修改

生成后先内部检查,不要直接交付未检查结果。

检查项:

  1. 图片是否满足用户核心意图:主体、用途、风格、比例、文字、平台或产物类型是否正确。
  2. 若使用 image_edit,检查参考图是否用对,核心资产识别是否被保留,是否误改 Logo、IP、人物、产品、包装或关键文字。
  3. 若是系列图,检查各图是否共享同一核心资产、视觉语言和必要的版式、色彩、材质锚点。
  4. 若结果明显偏离用户意图或一致性要求,先反思问题来源:参考图传错、核心资产未锁定、prompt 保留项不足、修改项冲突、产物 ref 选错或比例错误。

修改规则:

  • 最多修改一轮。
  • 修改时只修正导致偏差的关键问题,不重新发散方向。
  • 一轮修改后仍不理想时,交付当前最佳结果,并简短说明限制或需要用户补充的信息。

结果反馈

生成后不要机械复述“已完成”。如果结果可继续优化,只给 1-3 个具体方向,例如换比例、做系列延展、加强文字可读性、基于当前核心资产继续生成下一张。