GPTImage2 电商图片生成提示词工程

Other

GPTImage2 电商图片生成提示词工程

Install

openclaw skills install gpt-image-2-ecommerce-zh

GPTImage2 电商图片生成提示词工程

本技能由 coopeai.com 创制,为 OpenAI GPTImage2 图像生成模型提供专业的提示词编写指南与工程模式,专为电商商家、品牌设计师及数字营销人员优化。


1. GPTImage2 模型规格参考

1.1 模型能力概述

  • GPTImage2: OpenAI 旗舰级图像生成模型,原生集成推理能力。擅长精准遵循指令、在标签和包装上准确渲染文字、处理复杂多元素构图,以及模拟专业商品摄影效果。
  • 核心优势: 与 GPT-4o 共享同一推理底座,GPTImage2 能深度理解细腻的自然语言描述和空间逻辑——让你像专业摄影师布光一样描述一张照片,而不需要堆砌关键词标签。

突破一:推理思考模式(Thinking Mode)

GPTImage2 是业界首个 Agentic 图像生成模型——在渲染任何像素之前,它会主动研究、规划构图并自我检查。

  • 即时模式(Instant Mode)(免费):标准生成,具备强大的指令遵循能力。
  • 思考模式(Thinking Mode)(付费订阅):模型在生成前对布局、光影和主体关系进行深度推理。适用于复杂多商品构图、精细标签设计,或对空间关系有严格要求的场景。

电商使用建议:主图、包装效果图、或任何对精确物体位置和文字准确性有高要求的拍摄,优先使用思考模式。

突破二:多语言文字渲染近乎完美

GPTImage2 在拉丁字母、中日韩文(CJK)、印地语、孟加拉语、阿拉伯语等字符上实现约 ~99% 的字符级准确率——是所有前代图像生成模型中最大的飞跃。

  • 中文产品标签文字(如品牌名、成分标注)可准确渲染,不再出现乱码或虚构字符。
  • 在提示词中始终用双引号包裹目标文字:标签印有 "光感精华 GLOW"

突破三:多图生成与风格一致性

在思考模式下,GPTImage2 可从单个提示词生成最多 8 张风格一致的图像,在整组图片中保持一致的角色、物体、光影和视觉风格。

  • 适用场景:产品线系列营销图、A/B 创意变体、多角度商品图、Lookbook 系列。
  • 在提示词中指定数量:"生成同一款瓶子从 4 个不同角度拍摄的产品图,保持一致的光影和品牌美学风格。"

1.2 图像数量与一致性

  • 批量生成: 思考模式下每次请求支持生成 最多 8 张图像;即时模式下每次生成 1 张。
  • 风格一致性: 思考模式下,同批次所有图像自动保持一致的角色、物体、光影和视觉风格——无需额外的风格参考提示词即可完成系列商品图创作。
  • 物体还原度: 在精准描述的前提下,能可靠还原商品细节——标签文字、品牌色、材质质感。

1.3 支持的输出格式与尺寸

  • 预设画幅比例(1K 与 2K): GPTImage2 支持 9 种画幅比例,每种均提供 1K 和 2K 两档分辨率:

    画幅比例1K 分辨率2K 分辨率最适用场景
    1:11024×10242048×2048商品主图、社交帖子
    4:51024×12802048×2560Instagram、小红书信息流
    3:41024×13652048×2730竖版商品特写
    4:31365×10242730×2048横版商品展示
    3:21536×10243072×2048宽幅商品布局
    2:31024×15362048×3072手机详情页、Pinterest
    16:91820×10243640×2048网站 Banner、视频封面
    9:161024×18202048×3640抖音/Reels 广告、手机开屏图
    21:92048×878超宽全景通栏 Banner
  • 自定义尺寸: 任意自定义尺寸均有效,需满足以下条件:

    • 宽和高均为 16 的倍数
    • 单边不超过 3840 px
    • 画幅比例不超过 3:1
    • 总像素数在 655,360(最小)至 8,294,400(最大)之间
  • 4K 输出(测试版): 支持超过 2K 的尺寸(如 3840×2160 4K 横向、2160×3840 4K 纵向),目前处于实验阶段。

  • 画质档位:

    • low(低画质)— 快速生成,适合快速出概念图。
    • medium(中画质)— 速度与质量均衡,适合日常生产用途。
    • high(高画质)— 最高保真,适用于主图、印刷物料和最终投放素材。
  • 输出格式: png(默认,无损)、jpeg(文件更小)、webp(适合网页投放优化)。

  • 注意: GPTImage2 不支持透明背景输出。

1.4 图像编辑能力

  • 局部重绘(Edit API): 使用蒙版对已有商品图的特定区域进行精准修改——替换背景、调整道具、细化细节——无需重新生成整张图。
  • 外扩(Outpainting): 扩展已有图像的画布范围,用于生成更宽的 Banner 格式或添加环境场景。
  • 局部元素替换: 只替换某个单一元素(如产品标签),保持其余构图完整不变。

2. 提示词工程最佳实践

2.1 自然语言描述优于关键词堆砌

GPTImage2 是推理模型——用自然语言描述拍摄需求,就像给摄影师下简报一样。

  • 避免: "产品图, 白色背景, 8k, 清晰, 影棚灯光"
  • 推荐: "产品居中放置在纯白背景上的专业影棚照片,来自左上方的大型柔光箱提供柔和均匀的照明,产品正下方有细腻阴影。"

2.2 包装文字的精准渲染

GPTImage2 相较前代模型在文字渲染上有显著提升。以下技巧可最大化准确率:

  • 双引号硬性规则: 将需要渲染的精确文字用双引号包裹:标签印有 "PURE GLOW"
  • 字体风格描述: 指定字重和字形:粗体无衬线体细衬线斜体手写花体
  • 文字长度控制: 每行渲染文字建议控制在 20 个字符以内以保证准确性;长段正文用后期制作工具叠加图层。
  • 位置锚定: 明确文字位置:正面标签居中印在瓶盖顶边沿

2.3 光影规格描述

像电影摄影师一样描述布光:

  • 光源: 大型柔光箱环形灯来自画面左侧的窗户光单点硬聚光灯
  • 光线质感: 柔和漫射硬朗有向黄金时刻暖调光晕冷调阴天散射光
  • 阴影: 产品正下方柔和投影向右侧拉长的戏剧性阴影无可见阴影
  • 反射: 光滑黑色表面上的镜面反射哑光质感无高光反射

2.4 景深与镜头模拟

  • 浅景深: 浅景深,柔和焦外虚化,模拟 85mm f/1.8 人像镜头
  • 全景深: 从前景到背景全程清晰对焦,模拟 f/11 光圈
  • 微距特写: 极致微距特写,展现织物纹理与缝线细节

2.5 正向状态描述原则

描述目标最终效果,而不是描述要排除什么:

  • 避免: 无水印、无文字、无模糊区域
  • 推荐: 干净无标记的表面全程清晰对焦完美无瑕的商品

2.6 风格参考锚定

当需要在整个产品线中保持一致风格时,在所有提示词中添加统一的美学声明:

"保持品牌的干净极简美学:中性白色与暖灰色调,柔和漫射自然光,无硬阴影,细腻亚麻质感表面。"


3. 平台特定受众与风格映射

3.1 平台视觉策略

平台核心受众品牌定位视觉风格与提示词建议
小红书 (RED) / InstagramZ世代、年轻女性、潮流追随者颜值至上、生活方式、高情绪价值风格: 温暖、柔软、胶片质感、杂志排版、自然窗光。<br>关键词: warm morning window light, soft film grain, pastel color palette, cozy lifestyle vignette, editorial magazine composition
淘宝 / 天猫大众消费者、家庭群体、注重细节的买家实用主义、高清晰度、细节导向风格: 明亮、干净、色彩真实、专业影棚、锐利细节。<br>关键词: professional studio softbox lighting, ultra-sharp product detail, true-to-life color accuracy, centered balanced composition
京东 (JD.com)科技爱好者、男性、白领专业人士品质感、正品保障、现代科技风格: 未来感、金属质感、高端桌面环境、结构化戏剧光影。<br>关键词: futuristic tech product aesthetic, brushed metal reflections, sleek carbon fiber surface, cinematic sci-fi rim lighting
拼多多 / Temu价格敏感型、性价比追逐者即时价值感、强视觉冲击力风格: 高对比度、高饱和度鲜艳色彩、醒目吸睛构图。<br>关键词: vibrant saturated colors, high contrast dramatic lighting, bold central product placement, punchy studio spotlight
亚马逊 (Amazon)海外大众消费者、功能型买家产品透明度、高实用性、直观对比风格: 明亮、标准纯白背景、正面清晰呈现、完整细节。<br>关键词: pure white background, bright even softbox lighting, front-facing product view, all label text legible
独立站 (Shopify DTC)注重设计的买家、品牌拥趸品牌叙事、可持续生态、高端溢价风格: 现代极简、生态生活方式、有机阳光斑驳、中性大地色调。<br>关键词: minimalist brand aesthetic, natural sun-dappled light, neutral earthy tones, organic textures, intentional negative space

3.2 案例实操:单品("维生素C精华液")在不同平台的 Prompt 演变

1. 小红书 (RED) / Instagram(侧重:情调、生活方式)

  • Prompt 内容:

    一张带有氛围感的生活方式照片,一瓶磨砂玻璃滴管装维生素C精华液放置在温暖的大理石梳妆台上。一片新鲜橙子切片和散落的干花花瓣环绕周围。温暖柔和的晨光从旁边的窗户透入,在玻璃上形成轻柔的金色光晕。柔和胶片颗粒感,杂志美妆美学,温暖马卡龙色调。4:5 画幅,高画质。

2. 淘宝 / 天猫(侧重:细节、品质、清晰度)

  • Prompt 内容:

    一张专业影棚产品照片,磨砂玻璃维生素C精华液瓶(金色滴管盖)居中放置在光滑浅灰色水泥台座上。来自左上方明亮均匀的柔光箱照明突出瓶身浮雕纹理和标签文字"VITAMIN C 20%"。全图清晰对焦,产品下方有柔和干净的阴影,中性白色背景。1:1 画幅,高画质。

3. 京东 (JD.com)(侧重:科技感、高端品质)

  • Prompt 内容:

    一张高端产品照片,维生素C精华液瓶放置在深灰色板岩表面上。瓶子周围摆有抽象分子结构道具和一支干净试管。冷调影棚照明加微弱蓝色边缘轮廓光,营造现代科研感美学。干净背景带有微妙渐变。1:1 画幅,高画质。

4. 拼多多 / Temu(侧重:高视觉冲击、一眼吸睛)

  • Prompt 内容:

    一张充满活力的高对比度影棚产品照片,维生素C精华液瓶放置在鲜黄色亚克力台面上,带有强烈镜面反射。来自正上方的戏剧性聚光灯在橙色调瓶身上形成强烈高光。色彩鲜艳饱和,醒目居中构图,专为在信息流中瞬间抓住眼球而设计。1:1 画幅,高画质。

5. 亚马逊 (Amazon)(侧重:产品清晰度与白底标准)

  • Prompt 内容:

    一张干净专业的影棚产品照片,维生素C精华液瓶正面朝向镜头,纯白背景。来自左前方的明亮均匀柔光箱照明清晰呈现所有标签信息,包括"VITAMIN C 20% SERUM"文字和成分列表。无道具,无背景元素,所有产品细节清晰可见。1:1 画幅,高画质。

6. 独立站 (Shopify DTC)(侧重:天然、极简、品牌格调)

  • Prompt 内容:

    一张极简主义商品展示照片,维生素C精华液瓶置于白色亚麻桌布上,周围点缀新鲜橙子切片和绿色尤加利叶。柔和自然的斑驳阳光透过旁边窗户滤下,投下有机柔和阴影。中性大地色调,清新高端品牌感。4:5 画幅,高画质。


4. 专业电商提示词结构框架

按以下结构组织提示词,输出稳定、专业:

[镜头类型与整体基调] + [核心商品主体与细节] + [表面材质与环境] + [道具与场景上下文] + [光影描述] + [镜头与景深模拟] + [技术规格]

编写核心要点:

  1. 描述场景,而非堆砌关键词。 像给摄影师下简报一样写:场景、氛围、光源位置、拍摄角度。
  2. 文字必须加引号。 所有需要渲染在标签或包装上的文字必须用引号包裹:标签印有 "EARTH BREW"
  3. 明确表面物理交互关系。 说明产品是否投下阴影、是否有反射、是否与台面紧贴。
  4. 锁定美学风格词。 以风格锚定结尾:杂志美妆美学高端型录摄影温馨生活方式场景

5. 电商核心场景 Prompt 模板与实例

场景一:影棚白底/主图

  • 适用渠道: 电商主图、亚马逊、淘宝/天猫主图。

提示词模板:

[商品描述]的专业影棚产品照片,居中放置在[纯白/浅灰/米白]背景上。[布光描述,如"来自左上方明亮均匀的柔光箱照明"]。[对焦细节,如"清晰对焦于标签文字'[文字]'"]。产品正下方有干净柔和阴影,无道具。[尺寸],[画质]。

示例(护肤保湿霜):

一张白色哑光陶瓷保湿霜罐(金色瓶盖)的专业影棚产品照片,居中放置在纯白背景上。来自左上方明亮均匀的柔光箱照明突出浮雕 logo 和光滑陶瓷质感。清晰对焦于标签文字"HYDRA GLOW CREAM"。罐子正下方有干净柔和阴影,无道具。1024×1024,高画质。


场景二:情景生活化/种草海报图

  • 适用渠道: 小红书封面图、详情页、社交媒体大图。

提示词模板:

一张富有氛围感的生活方式照片,[商品]摆放在[环境]的[放置表面]上。[场景道具]点缀周围,营造[目标情绪氛围]。[光影描述]。[镜头模拟]。[尺寸],[画质]。

示例(香薰蜡烛):

一张富有氛围感的生活方式照片,白色大理石纹蜡烛罐(已点燃)放置在质朴橡木床头柜上。旁边放着一本亚麻封面笔记本和一小枝干燥薰衣草,营造宁静夜读氛围。来自床头灯的温暖昏黄灯光在场景中投下柔和光晕。浅景深,背景柔和虚化,模拟 50mm f/2.0 镜头。1024×1536,高画质。


场景三:电商通栏横幅海报

  • 适用渠道: 网站首页 Banner、App 首屏大图、类目导航头图。

提示词模板:

宽幅电商营销 Banner,[商品/主体]位于画面[左/右]侧,在[右/左]侧留出干净的留白区域用于文字叠加。背景为[描述]。[风格]。[光影]。1536×1024,[画质]。

示例(运动鞋):

宽幅电商营销 Banner,一只荧光绿性能跑鞋悬浮于画面左侧,带有动态运动模糊轨迹暗示速度感。画面右三分之二区域是干净的深炭灰色渐变,为大标题文字预留充足留白空间。跑鞋鞋面带有戏剧性边缘轮廓光。充满活力的运动美学风格。1536×1024,高画质。


场景四:模特穿搭/服装展示图

  • 适用渠道: 服装主图、Lookbook、详情页。

提示词模板:

一张高端时尚电商型录照片,[模特描述]在[场景]中穿着[服装描述]。[姿态与表情]。[光影描述]。自然皮肤纹理,真实面料垂坠感和折痕细节。[尺寸],[画质]。

示例(宽松西装外套):

一张高端时尚电商型录照片,一名二十多岁南亚女模特在极简哥本哈根风格公寓中穿着宽松驼色羊毛西装外套搭配宽松长裤。她站在大窗户旁,自然放松地将一手插入口袋,微微侧头望向画面外,表情平静。来自左侧柔和漫射自然窗光突显羊毛质感和结构化肩线。自然皮肤纹理,真实面料垂坠感。1024×1536,高画质。


场景五:包装效果图与文本排版

  • 适用渠道: 包装概念设计、标签设计、推广物料模板。

提示词模板:

[包装类型]的特写包装样机,用于[产品/品牌]。包装采用[颜色/设计描述],正面标签以[字体风格]字体印有文字"[精确文字]"。表面为[哑光/光泽/烫金]饰面。[光影描述]。清晰对焦于所有印刷文字。[尺寸],[画质]。

示例(咖啡袋):

精品咖啡牛皮纸立袋的特写包装样机。包装采用极简米色标签设计,正面以粗体几何无衬线字体印有"MORNING RITUAL",下方以细字重字体印有"SINGLE ORIGIN ETHIOPIA"。牛皮纸表面具有天然纹理质感,哑光黑色印刷。温暖柔和的影棚照明,板岩灰背景。清晰对焦于所有印刷文字,高保真文字渲染。1024×1024,高画质。


6. Edit API 图像编辑使用指南

GPTImage2 支持通过图像编辑 API 进行精准局部修改。以下是产品图迭代精修的常用模式:

  1. 背景替换:

    • 蒙版区域:产品周围的背景区域。
    • 提示词:"将背景替换为阳光普照的沙滩,远处有柔和的海浪,保留产品及其阴影完全不变。"
  2. 光影色调调整:

    • 蒙版区域:整张图或特定高光区域。
    • 提示词:"增强产品左侧的黄金时刻暖光,在金属瓶盖上形成更强烈的边缘轮廓光和光晕高光。"
  3. 道具添加:

    • 蒙版区域:产品旁边的空白台面区域。
    • 提示词:"在瓶子右侧台面上平放一朵白色牡丹花,确保其阴影方向与现有光源方向一致。"
  4. 标签文字修正:

    • 蒙版区域:仅标签区域。
    • 提示词:"将标签文字替换为 'RENEWED',保持相同的粗体黑色无衬线字体、相同字号和位置,其余所有视觉元素保持不变。"
  5. 瑕疵与缺陷消除:

    • 蒙版区域:特定瑕疵所在区域。
    • 提示词:"消除该表面瑕疵,同时保持玻璃瓶原有光泽度、折射率和边缘反光完全不变。"