Install
openclaw skills install sudocode-gpt-image-2-gen图片生成技能,当用户需要生成图片、视觉信息图、创建图像、编辑/修改/调整已有图片时使用此技能。基于 SudoCode 平台(https://sudocode.us)的 GPT Image 2 模型图片生成服务。该模型支持精确的尺寸/画质控制(含4K),按token计费。关键点:使用 /v1/images/generations 和 /v1/images/edits 端点;有显式 size 参数;有 quality 参数;使用 multipart/form-data 上传参考图;b64_json 为纯 base64 无前缀。
openclaw skills install sudocode-gpt-image-2-gen基于基于 SudoCode 平台的 GPT Image 2 模型实现图片生成技能,可以通过自然语言帮助用户生成图片,支持 Node.js 和 Python 两种运行环境。该模型支持精确的尺寸/画质控制(含 4K)。
遵循以下步骤:
明确意图:区分用户是需要【文生图】(生成新图片)还是【图生图】(编辑/修改现有图片)或【多图融合】。
提示词(Prompt)分析:
-p 提示词的主体,避免自行改写、总结或二次创作,防止细节丢失。-p "帮我生成一张猫的图片,风格要可爱一点。"-p "帮我生成一张猫的图片,风格要可爱一点。猫是橘色的,背景是草地。"关键参数整理:
cat_in_garden.png),避免使用通用名。1024x1024、1536x1024、1024x1536、2048x2048、2048x1152、3840x2160、2160x3840low(草图/批量)、medium(日常)、high(终稿/精细文字)、auto(默认)png(默认)、jpeg、webp检查环境:确认 SUDOCODE_API_KEY 环境变量是否已设置(通常假定已设置,若运行失败再提示用户)���
构建并运行命令:
node 命令可用),优先使用 scripts/generate_image.js(零依赖,参数与 Python 保持一致)。scripts/generate_image.py。文生图命令模板(优先 Node.js):
node scripts/generate_image.js -p "{prompt}" -f "{filename}" [-s {size}] [-q {quality}] [-o {output_format}]
图生图命令模板(优先 Node.js):
node scripts/generate_image.js -p "{edit_instruction}" -i "{input_path}" -f "{output_filename}" [-s {size}] [-q {quality}]
多图融合命令模板(优先 Node.js):
node scripts/generate_image.js -p "融合图1和图2的风格" -i ref1.png ref2.png -f "merged.png" [-s {size}] [-q {quality}]
(可选)Python 版本命令模板(Node 不可用时):
python scripts/generate_image.py -p "{prompt}" -f "{filename}" [-s {size}] [-q {quality}] [-o {output_format}]
python scripts/generate_image.py -p "{edit_instruction}" -i "{input_path}" -f "{output_filename}" [-s {size}] [-q {quality}]
执行前必须告知用户:
"图片生成中,预计120-150秒完成...\n⏳ 正在生成...\n(high + 2K/4K 复杂场景可能需要更长时间,请耐心等待)"
python scripts/generate_image.py -p "图片描述文本" -f "output.png" [-s {size}] [-q {quality}] [-o {output_format}]
示例:
# 基础生成
python scripts/generate_image.py -p "一只可爱的橘猫在草地上玩耍" -f "cat.png"
# 指定尺寸和画质
python scripts/generate_image.py -p "日落山脉风景" -f "sunset.png" -s "2048x1152" -q "high"
# 竖版高清图片(适合手机壁纸)
python scripts/generate_image.py -p "城市夜景" -f "city.png" -s "2160x3840" -q "high"
# 输出为JPEG
python scripts/generate_image.py -p "风景照片" -f "landscape.jpg" -s "3840x2160" -q "high" -o "jpeg"
(可选)Node.js 版本示例:
# 基础生成
node scripts/generate_image.js -p "一只可爱的橘猫在草地上玩耍" -f "cat.png"
# 指定尺寸和画质
node scripts/generate_image.js -p "日落山脉风景" -f "sunset.png" -s "2048x1152" -q "high"
python scripts/generate_image.py -p "编辑指令" -f "output.png" -i "path/to/input.png" [-s {size}] [-q {quality}]
示例:
# 修改风格
python scripts/generate_image.py -p "将图片转换成水彩画风格" -f "watercolor.png" -i "original.png"
# 添加元素
python scripts/generate_image.py -p "在天空添加彩虹" -f "rainbow.png" -i "landscape.png" -q "high"
# 替换背景
python scripts/generate_image.py -p "将背景换成海滩" -f "beach-bg.png" -i "portrait.png" -s "2048x2048"
(可选)Node.js 版本示例:
# 修改风格
node scripts/generate_image.js -p "将图片转换成水彩画风格" -f "watercolor.png" -i "original.png"
# 多��参考图融合(最多5张)
node scripts/generate_image.js -p "把图1的人物放进图2的场景" -i ref1.png ref2.png -f "merged.png"
Python 与 Node.js 版本参数保持一致(短参数与长参数等价)。
| 参数 | 必填 | 说明 |
|---|---|---|
-p / --prompt | 是 | 图片描述(文生图)或编辑指令(图生图)。保留用户原始完整输入。 |
-f / --filename | 否 | 输出图片路径/文件名;不传则自动生成带时间戳的文件名。 |
-s / --size | 否 | 输出尺寸:1024x1024 / 1536x1024 / 1024x1536 / 2048x2048 / 2048x1152 / 3840x2160 / 2160x3840 或自定义尺寸。 |
-q / --quality | 否 | 画质档位:low / medium / high / auto(默认auto)。 |
-o / --output-format | 否 | 输出格式:png(默认)/ jpeg / webp。 |
-c / --output-compression | 否 | 输出压缩率(0-100),仅jpeg/webp生效。 |
-i / --input-image | 否 | 图生图输入图片路径;可传多张(最多5张)。传入该参数即进入编辑模式。 |
| 尺寸 | 比例 | 适用场景 |
|---|---|---|
| 1024x1024 | 1:1 | 头像、Instagram帖子 |
| 1536x1024 | 3:2 | 标准横版 |
| 1024x1536 | 2:3 | 标准竖版 |
| 2048x2048 | 1:1 | 高清方图 |
| 2048x1152 | 16:9 | 横版视频封面、桌面壁纸 |
| 3840x2160 | 16:9 | 4K超高清 |
| 2160x3840 | 9:16 | 竖版4K |
可使用任意合法自定义尺寸,需满足:
| 画质 | 说明 | 适用场景 |
|---|---|---|
| low | 草图/批量生成 | 快速预览、多次迭代 |
| medium | 日常 | 普通使用 |
| high | 终稿/精细文字 | 最终输出、包含文字的图像 |
| auto | 默认 | 由模型决定 |
| 格式 | 说明 | 适用场景 |
|---|---|---|
| png | 无压缩,透明背景 | 需要透明背景、保留最佳画质 |
| jpeg | 有压缩 | 照片、存储空间敏感 |
| webp | 现代格式 | Web使用、平衡画质与大小 |
注意:b64_json字段是纯base64,不含 data:image/...;base64, 前缀。客户端需要:
base64.b64decode(b64_str) → 写入磁盘data:image/png;base64, + b64如果你还没有 API 密钥,请前往 https://sudocode.us 获取或管理 API Key。
获取步骤:
脚本按以下顺序查找API密钥:
--api-key 命令行参数(临时使用)SUDOCODE_API_KEY 环境变量(推荐)设置环境变量(推荐):
# Linux/Mac
export SUDOCODE_API_KEY="your-api-key-here"
# Windows CMD
我的电脑高级设置中设置环境变量或者执行set SUDOCODE_API_KEY=your-api-key-here
# Windows PowerShell
在我的电脑中设置环境变量:$env:SUDOCODE_API_KEY="your-api-key-here"
命令行参数方式(临时):
python scripts/generate_image.py -p "一只猫" -k "your-api-key-here"
文生图端点,使用JSON格式请求。
图生图端点,使用multipart/form-data格式请求。上传参考图(最多5张)+ 指令进行单图改图、多图融合。
参考图顺序有意义,prompt中可用"图1/图2/图3"指代。
| 特性 | gpt-image-2 | gpt-image-2-all |
|---|---|---|
| 性质 | 官方正式版 | 官方逆向版 |
| 计费 | 按token | 统一$0.03/张 |
| 端点 | /v1/images/generations, /v1/images/edits | /v1/chat/completions |
| 上传参考图 | multipart form-data | base64 data URL |
| 下载图片 | b64_json(纯base64) | url或b64_json(带前缀) |
| 多图融合 | image[]数组最多5张 | chat多个image_url |
| 尺寸控制 | 显式size参数 | prompt描述 |
| 速度 | 约120-150秒 | 约60-300秒 |