Install
openclaw skills install wangyan-gemini-image-genGenerate, edit, and compose images using Gemini models. Activate when user asks to generate images, draw, create logos/posters/icons/banners, edit/modify photos, combine images, or any image creation task. 画图、生成图片、做图、P图、修图、合成图、做logo、做海报、做图标、做封面、品牌视觉、Nano Banana、Banana。
openclaw skills install wangyan-gemini-image-gen通过 Nano Banana 实现文生图、图片编辑与多图合成,支持 OpenAI 兼容和 Google 原生两种 API 格式,可自定义端点和密钥。
本技能需要 python3 和 uv 环境。
# macOS
brew install python3
# Ubuntu/Debian
sudo apt update && sudo apt install python3 python3-pip
#CentOS/RHEL
sudo yum install python3 python3-pip
uv 是一个极速的 Python 包管理器,用于运行脚本和管理依赖。
# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh
# 使用 pip
pip install uv
# 确保 `uv` 在 PATH 中可用
uv --version
# github 镜像源
npx skills add https://github.com/wangyan/wangyan-skills/tree/main/skills/gemini-image-gen
# gitcode 镜像源 (推荐国内用户使用)
npx skills add https://gitcode.com/wang_yan/wangyan-skills.git
# 使用 Clawhub CLI 安装
npx clawhub@latest install wangyan-gemini-image-gen
# 使用腾讯 skillhub 安装 (推荐国内用户使用)
curl -fsSL https://skillhub-1388575217.cos.ap-guangzhou.myqcloud.com/install/install.sh | bash -s -- --no-skills
skillhub install wangyan-gemini-image-gen
运行时需要提供 GEMINI_API_KEY 和 GEMINI_BASE_URL,可以通过命令行参数、环境变量或 .env 文件提供。
{
"skills": {
"entries": {
"gemini-image-gen": {
"enabled": true,
"apiKey": "your-api-key",
"env": {
"GEMINI_API_KEY": "your-api-key",
"GEMINI_BASE_URL": "https://api.example.com/v1",
"GEMINI_MODEL": "gemini-3.1-flash-image-preview",
"GEMINI_API_FORMAT": "openai",
"GEMINI_TIMEOUT": "300",
"GEMINI_RESOLUTION": "1K",
"GEMINI_OUTPUT_DIR": "output/images"
}
}
}
}
}
配置按以下优先级加载(高优先级覆盖低优先级):
命令行参数 > 环境变量 > 技能目录 .env
你也可以使用 .env 文件来配置参数,支持以下位置(按优先级排序):
| 位置 | 优先级 | 说明 |
|---|---|---|
技能目录/.env | 最高 | 技能本地配置,推荐 |
~/.openclaw/.env | 中 | 全局配置,所有技能共享 |
/workspace/.env | 最低 | 沙箱环境配置 |
创建 .env 文件:
cd ~/.openclaw/skills/gemini-image-gen
cp .env.example .env
# 编辑 .env 填入你的配置
nano .env
示例 .env 文件:
# 必填配置
GEMINI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
GEMINI_BASE_URL=https://api.example.com/v1
# 可选配置
GEMINI_MODEL=gemini-3.1-flash-image-preview
GEMINI_API_FORMAT=openai
GEMINI_TIMEOUT=300
GEMINI_RESOLUTION=1K
GEMINI_OUTPUT_DIR=output/images
| 参数 | 环境变量 | 说明 |
|---|---|---|
--prompt / -p | - | 图片描述或编辑指令(必填) |
--filename / -f | - | 输出文件名(必填) |
--api-key / -k | GEMINI_API_KEY | API 密钥(运行时必填,可由命令行、环境变量或 .env 提供) |
--base-url / -b | GEMINI_BASE_URL | API 端点 URL(运行时必填,可由命令行、环境变量或 .env 提供) |
--model / -m | GEMINI_MODEL | 模型名称(默认自动轮询) |
--api-format / -F | GEMINI_API_FORMAT | openai(默认)或 google |
--timeout / -t | GEMINI_TIMEOUT | 超时秒数(默认 300) |
--resolution / -r | GEMINI_RESOLUTION | 1K(默认)、2K、4K |
--output-dir / -o | GEMINI_OUTPUT_DIR | 输出目录(默认 output/images) |
--input-image / -i | - | 输入图片路径(可重复,最多 14 张) |
--aspect-ratio / -a | - | 宽高比(1:1、16:9、9:16、4:3、3:4、3:2、2:3) |
--quality | - | 图片质量(standard 默认、hd) |
--style | - | 风格(natural 默认、vivid) |
--no-timestamp | - | 不自动添加时间戳前缀 |
--verbose / -v | - | 输出详细调试信息 |
⚠️ 重要:脚本必须在工作区目录下运行,不要
cd到技能目录。输出路径output/images是相对于工作目录的。
📤 图片发送:脚本成功后会输出
IMAGE_PATH: /absolute/path/to/image.png,agent 从输出中提取路径,然后调用message(action=send, media=<path>)发送给用户。不依赖MEDIA:行机制。
uv run {baseDir}/scripts/generate_image.py --prompt "图片描述" --filename "output.png"
uv run {baseDir}/scripts/generate_image.py --prompt "编辑指令" --filename "edited.png" -i "/path/input.png" --resolution 2K
uv run {baseDir}/scripts/generate_image.py --prompt "合成指令" --filename "composed.png" -i img1.png -i img2.png -i img3.png
uv run {baseDir}/scripts/generate_image.py --prompt "描述" --filename "output.png" \
--base-url "https://example.com/v1" --api-key "sk-xxx" --model "gemini-3.1-flash-image-preview"
uv run {baseDir}/scripts/generate_image.py --prompt "描述" --filename "output.png" --api-format google
脚本执行完成后,从输出中提取 IMAGE_PATH: 行的路径,然后调用:
message(action=send, channel=<channel>, media=<image_path>)
脚本内置模型自动轮询机制,当首选模型不可用时,会自动尝试备选模型:
轮询顺序:
gemini-3.1-flash-image-preview(默认首选)gemini-3-pro-image-preview(备选1)gemini-2.5-flash-image(备选2)触发条件:
自定义模型:
如果通过 --model 指定了自定义模型,脚本会先尝试该模型,失败后再按上述顺序轮询。
yyyy-mm-dd-hh-mm-ss-name.pngIMAGE_PATH: /absolute/path/to/image.pngmessage(action=send, media=<path>) 发送图片MEDIA: 行机制,在飞书等渠道不可靠本技能发送图片依赖 Messaging 权限(message 工具)。
使用前请确认 OpenClaw 已配置消息渠道(如飞书、Telegram 等),否则图片只会保存到本地,无法发送给用户。