Kay Image - AI 图片生成与理解
基于 KIE AI API 的图片生成与理解工具。
⚠️ 必需凭证
使用本工具前,必须配置 API Key:
获取 KIE API Key
- 访问 https://kie.ai/
- 注册并登录账号
- 进入控制台 → API 管理
- 创建 API Key 并复制
配置环境变量
export KIE_API_KEY="your-kie-api-key-here"
或在 skill 目录创建 .env 文件:
# 创建 .env 文件
nano skills/kay-image/.env
.env 文件内容:
KIE_API_KEY=your-kie-api-key-here
注意: 没有 API Key 将无法使用本工具的任何功能。
特性
- 文生图: 根据文本描述生成图片
- 图生图: 基于参考图进行编辑/变换
- 图片理解: 分析图片内容(使用 GPT-5/Gemini)
- 视频理解: 分析视频内容(使用 Gemini)
- 多分辨率: 支持 1K/2K/4K 输出
- 多宽高比: 支持 1:1, 3:4, 4:3, 9:16, 16:9, 21:9 等
使用方法
基本文生图
kay-image --prompt "一只可爱的橘猫在草地上玩耍" --output cat.png
指定宽高比和分辨率
kay-image --prompt "上海外滩夜景" --output shanghai.png --ar 16:9 --resolution 2K
图生图
kay-image --prompt "转换成动漫风格" --input https://example.com/photo.jpg --output anime.png
图片理解
kay-image --understand --image https://example.com/photo.jpg --prompt "描述这张图片"
视频理解
kay-image --understand --video https://example.com/video.mp4 --prompt "分析这个视频"
参数说明
| 参数 | 简写 | 说明 | 默认值 |
|---|
--prompt | -p | 提示词 | - |
--output | -o | 输出路径 | - |
--input | -i | 参考图路径 | - |
--ar | - | 宽高比 | 1:1 |
--resolution | -r | 分辨率 | 1K |
--understand | -u | 理解模式 | false |
--image | - | 图片路径 | - |
--video | - | 视频路径 | - |
环境变量
| 变量名 | 必需 | 说明 |
|---|
KIE_API_KEY | ✅ 是 | KIE AI API 密钥 |
KIE_UNDERSTANDING_API_KEY | ❌ 否 | 理解功能 API 密钥(默认使用 KIE_API_KEY) |
LAOZHANG_API_KEY | ❌ 否 | LaoZhang API 密钥(可选) |
价格参考
- 1K 图片: ~$0.04
- 2K 图片: ~$0.06
- 4K 图片: ~$0.09
- 图片理解: ~$0.005-0.01/张
支持的宽高比
1:1 - 正方形
3:4 - 小红书/Instagram 竖版
4:3 - 标准横版
9:16 - 手机竖屏
16:9 - 宽屏
21:9 - 超宽屏
示例
生成小红书封面
kay-image -p "清新风格护肤品封面,粉色渐变背景" -o cover.png --ar 3:4 -r 2K
生成头像
kay-image -p "动漫风格女生头像,粉色头发" -o avatar.png --ar 1:1
图片风格迁移
kay-image -p "转换成油画风格" -i photo.jpg -o painting.png
OCR 文字提取
kay-image -u --image document.jpg --prompt "提取所有文字"
脚本位置
${SKILL_DIR}/scripts/main.ts
注意事项
- 视频理解: 仅 Gemini 模型支持
- 图片格式: 支持 JPG、PNG、WebP
- 视频格式: 支持 MP4、MOV
- 文件大小: 建议图片 < 10MB,视频 < 100MB