---
name: comfyui-client
description: 此技能应在用户需要通过 ComfyUI 生成图片或视频时使用。支持加载工作流、修改 prompt、提交任务、轮询结果并自动下载生成的图片和视频。需 ComfyUI 服务已启动。
version: 1.2.0
author: agent-js
---

# ComfyUI 工作流客户端

## 概述

本技能封装了 ComfyUI 工作流调用能力，用于通过 ComfyUI API 生成图片和视频。核心功能包括：加载工作流 JSON、修改 prompt 和图片节点、提交到 ComfyUI 队列、轮询任务状态、自动下载生成结果。

**适用场景：**
- 用户要求根据文本描述生成图片
- 用户要求根据参考图生成变体或编辑
- 用户要求生成图片转视频、图生视频
- 需要批量或自动化调用 ComfyUI 工作流

**前置条件：**
- ComfyUI 服务已启动（默认 `http://127.0.0.1:8188`）
- 工作流 JSON 文件可用
- 工作流所需模型已安装到 ComfyUI

## 触发条件

当满足以下条件时应使用此技能：

1. **用户表达生成意图**
   - 要求"用 ComfyUI 生成图片"、"根据 prompt 画图"
   - 要求"图生图"、"图片编辑"、"生成视频"
   - 提供文本描述并希望得到 AI 生成的图像

2. **技术上下文明确**
   - 用户提到 ComfyUI、工作流、txt2img、img2img 等
   - 用户提供工作流文件路径或项目内已知工作流

3. **服务可用**
   - 可先检查 ComfyUI 服务是否可访问
   - 若不可用，应提示用户启动 ComfyUI

## 捆绑资源

**脚本：** `scripts/comfyUIClient.js` - ComfyUI 工作流调用主脚本

**工作流：** `assets/workflows/` - 5 个常用工作流（Z-Image、Qwen 编辑、Wan 视频等）

**执行方式：**
- 技能内脚本：`node .claude/skills/comfyui-client/scripts/comfyUIClient.js [选项]`
- 项目脚本（等效）：`node scripts/comfyUIClient.js [选项]`

**路径解析：** 技能内脚本会自动解析项目根目录，工作流路径和输出目录支持相对路径（相对于项目根）。

## 核心能力

### 1. 文生图（txt2img）

使用文本 prompt 生成图片。

**基本用法：**
```bash
node scripts/comfyUIClient.js --workflow <工作流路径> --prompt "<提示词>"
```

**示例：**
```bash
# 使用技能内工作流（推荐）
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo.json \
  --prompt "a beautiful landscape at sunset"

# 带负面提示词
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo.json \
  --prompt "a beautiful landscape at sunset" \
  --negative-prompt "blurry, low quality, watermark"
```

**自动查找 prompt 节点：** 若不指定 `--prompt-node`，脚本会自动查找工作流中标题含 "Positive" 的 `CLIPTextEncode` 节点注入正面 prompt，标题含 "Negative" 的节点用于负面 prompt。对于 `TextEncodeQwenImageEditPlus`，优先选择有非空文本或标题含 "Positive" 的节点。

### 2. 指定 prompt 节点

当工作流中有多个 CLIPTextEncode 节点时，可指定要修改的节点 ID。

```bash
node scripts/comfyUIClient.js --workflow <工作流路径> --prompt-node "45" --prompt "新的提示词"
```

### 3. 图生图 / 图片编辑（img2img）

需要提供输入图片。可使用 `--image-path` 指定本地路径（自动上传到 ComfyUI），或先将图片放入 ComfyUI 的 `input/` 目录后使用 `--image-file` 指定文件名。

#### 3a. Z-Image Turbo + ControlNet（结构引导重绘）

基于 Canny 边缘检测提取输入图片轮廓，用 ControlNet 引导模型生成新图。适合风格转换、基于轮廓的重绘。

- **输入**：1 张图片 + 文本 prompt
- **速度**：快（9 步，CFG=1）
- **LoadImage 节点 ID**：`58`
- **Prompt 节点**：自动查找（子图内部 CLIPTextEncode 会被展开到顶层）

```bash
# 使用 --image-path 自动上传本地图片（推荐）
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo_fun_union_controlnet.json \
  --prompt "oil painting style, vibrant colors" \
  --image-node 58 --image-path "path/to/input_photo.png"

# 或使用已上传到 ComfyUI input/ 的图片
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo_fun_union_controlnet.json \
  --prompt "oil painting style, vibrant colors" \
  --image-node 58 --image-file "input_photo.png"
```

> 注意：该工作流使用子图（subgraph），脚本会自动展开子图内部节点。

#### 3b. Qwen 图片编辑（语义级多图编辑）

基于 Qwen 视觉语言模型的智能编辑。支持自然语言编辑指令和最多 3 张参考图片。适合材质替换、风格迁移、多图参考编辑。

- **输入**：1-3 张图片 + 自然语言编辑指令
- **速度**：中等（20 步，CFG=4）
- **LoadImage 节点 ID**：主图 `41`，参考图2 `83`，参考图3 `87`（默认禁用）
- **Prompt 节点 ID**：正面 `68`，负面 `69`
- 可选 Lightning LoRA 加速到 4 步（节点 74，默认禁用）

```bash
# 单图编辑
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_qwen_image_edit_2511.json \
  --prompt-node 68 --prompt "将背景改为海边夕阳" \
  --image-node 41 --image-file "sofa.png"

# 多图材质替换（图1 主图 + 图2 参考材质）
node .claude/skills/comfyui-client/scripts/comfyUIClient.js \
  --workflow .claude/skills/comfyui-client/assets/workflows/image_qwen_image_edit_2511.json \
  --prompt-node 68 --prompt "Change the furniture leather in image 1 to the fur material in image 2." \
  --image-node 41 --image-file "leather_sofa.png" \
  --image-node2 83 --image-file2 "texture_fur.png"
```

> 注意：Qwen Edit 工作流的 prompt 节点不是 CLIPTextEncode，需使用 `--prompt-node 68` 明确指定。

#### 3c. 两种图片编辑工作流如何选择

| 维度 | **Qwen 图片编辑** | **Z-Image Turbo + ControlNet** |
|------|------------------|--------------------------------|
| 技术路线 | Qwen 视觉语言模型，语义理解 | Canny 边缘 + ControlNet 结构引导 |
| 输入 | 1–3 张图 + 自然语言指令 | 1 张图 + 文本 prompt |
| 速度 | 较慢（约 20 步） | 快（9 步） |
| 结构保持 | 依赖模型理解，可能变化 | 强约束，轮廓基本不变 |

**Qwen 编辑适用场景：**
- 材质替换（如「把图 1 的皮质换成图 2 的毛绒材质」）
- 多图参考编辑（主图 + 1–2 张参考图）
- 语义级修改（背景、颜色、风格等需理解图像内容的编辑）
- 自然语言编辑指令（支持「将背景改为海边夕阳」等描述）

**ControlNet 适用场景：**
- 风格转换（保持轮廓，只改风格，如照片→油画、素描）
- 轮廓重绘（基于边缘线生成新图，构图基本不变）
- 线稿上色、结构保持的变体
- 追求速度、快速出图

**快速选择：**
- 需要**理解图像内容**做语义修改 → 选 **Qwen 编辑**
- 需要**保持构图/轮廓**做风格转换 → 选 **ControlNet**

### 4. 视频生成

支持 img2video、flf2video 等工作流。视频生成耗时较长，建议适当增加超时时间。

```bash
node .claude/skills/comfyui-client/scripts/comfyUIClient.js --workflow .claude/skills/comfyui-client/assets/workflows/video_wan2_2_14B_i2v.json --prompt "视频描述" --timeout 900
```

## 命令行选项

| 选项 | 说明 | 默认值 |
|-----|------|--------|
| `--workflow <file>` | 工作流 JSON 文件路径（必需） | - |
| `--server <url>` | ComfyUI 服务器地址 | `http://127.0.0.1:8188` |
| `--client-id <id>` | 客户端 ID | 自动生成 |
| `--prompt-node <node_id>` | 要修改的 prompt 节点 ID | 自动查找 |
| `--prompt <text>` | 新的 prompt 文本 | - |
| `--negative-prompt-node <node_id>` | 负面 prompt 节点 ID | 自动查找 |
| `--negative-prompt <text>` | 负面 prompt 文本 | - |
| `--image-node <node_id>` | 主图 LoadImage 节点 ID | - |
| `--image-file <filename>` | 主图已上传文件名（或上传后的目标名） | - |
| `--image-path <path>` | 主图本地路径，将自动上传 | - |
| `--image-node2 <node_id>` | 第二张参考图 LoadImage 节点 ID | - |
| `--image-file2 <filename>` | 第二张参考图已上传文件名 | - |
| `--image-path2 <path>` | 第二张图本地路径，将自动上传 | - |
| `--image-node3 <node_id>` | 第三张参考图 LoadImage 节点 ID | - |
| `--image-file3 <filename>` | 第三张参考图已上传文件名 | - |
| `--image-path3 <path>` | 第三张图本地路径，将自动上传 | - |
| `--output-dir <dir>` | 输出目录 | `./work_dir/comfyui_output` |
| `--session-name <name>` | 会话名称 | 自动生成时间戳 |
| `--timeout <seconds>` | 超时时间（秒） | 600 |
| `--poll-interval <ms>` | 轮询间隔（毫秒） | 1000 |
| `--help` | 显示帮助信息 | - |

## 环境变量

- `COMFYUI_SERVER_URL` - ComfyUI 服务器地址，可覆盖 `--server` 默认值

## 输出结构

每次执行会创建独立会话目录：

```
work_dir/comfyui_output/
└── comfyui_<时间戳>/
    ├── session_info.json    # 会话配置信息
    ├── workflow.json        # 实际提交的工作流（含修改后参数）
    ├── result.json          # 执行结果（prompt_id、生成文件列表等）
    ├── <nodeId>_<filename>  # 生成的图片/视频文件
    └── error.json          # 失败时的错误信息（如有）
```

## 捆绑工作流（assets/workflows）

本技能在 `assets/workflows/` 目录下捆绑了常用工作流，优先使用：

| 工作流 | 路径 | 用途 | Prompt 节点 | Image 节点 |
|-------|------|------|------------|-----------|
| z_image_turbo | `.claude/skills/comfyui-client/assets/workflows/image_z_image_turbo.json` | 文生图（快速出图，9 步） | 自动 | - |
| z_image_turbo_controlnet | `.claude/skills/comfyui-client/assets/workflows/image_z_image_turbo_fun_union_controlnet.json` | ControlNet 结构引导重绘 | 自动（子图展开后） | `58` |
| qwen_image_edit | `.claude/skills/comfyui-client/assets/workflows/image_qwen_image_edit_2511.json` | Qwen 多图语义编辑 | `68`（正面），`69`（负面） | `41`（主图），`83`（参考2），`87`（参考3） |
| wan_i2v | `.claude/skills/comfyui-client/assets/workflows/video_wan2_2_14B_i2v.json` | Wan 2.2 图生视频 | 自动 | - |
| wan_flf2v | `.claude/skills/comfyui-client/assets/workflows/video_wan2_2_14B_flf2v.json` | Wan 2.2 首尾帧视频 | 自动 | - |

## 其他工作流（项目内）

| 工作流 | 路径 | 用途 |
|-------|------|------|
| txt2img | `scripts/githubToXPost/workflows/txt2img.json` | 文生图 |
| img_edit | `scripts/githubToXPost/workflows/img_edit.json` | 图片编辑 |
| controlnet | `scripts/githubToXPost/workflows/controlnet.json` | ControlNet 图生图 |
| img2video | `scripts/githubToXPost/workflows/img2video.json` | 图生视频 |
| flf2video | `scripts/githubToXPost/workflows/flf2video.json` | 首尾帧生成视频 |

## 模块引用

脚本支持作为 Node.js 模块引用，用于集成到其他工作流（如 githubToXPost 的 imageGenerator）。

```javascript
const ComfyUIClient = require('./scripts/comfyUIClient');

const client = new ComfyUIClient({
    workflowFile: 'scripts/githubToXPost/workflows/txt2img.json',
    prompt: 'a beautiful landscape',
    serverUrl: 'http://127.0.0.1:8188',
    outputDir: './work_dir/comfyui_output'
});

const result = await client.execute();
console.log('生成文件:', result.generatedFiles);
```

## 工作流格式说明

脚本支持两种工作流格式：

1. **ComfyUI 完整格式**（含 `nodes`、`links` 数组）- 自动转换为 API 格式
2. **API 格式**（以节点 ID 为 key 的对象）- 直接使用

**自动预处理：**
- **子图展开**：包含 `definitions.subgraphs` 的工作流会自动展开子图内部节点到顶层，重映射连接关系
- **旁路节点处理**：`mode=4`（旁路）的节点自动透传输入到输出；`mode=2`（静音）的节点自动移除
- **非执行节点**：MarkdownNote、Note 等非执行节点会自动跳过

## 错误处理

### 常见问题

**1. ComfyUI 服务不可用**
- 确认 ComfyUI 已启动
- 检查 `--server` 或 `COMFYUI_SERVER_URL` 是否正确
- 可访问 `http://127.0.0.1:8188` 验证

**2. 工作流文件不存在**
- 确认 `--workflow` 路径正确
- 从项目根目录执行，或使用绝对路径

**3. 任务超时**
- 视频生成等耗时任务可增加 `--timeout`（如 900 或 1200）
- 检查 ComfyUI 队列是否堆积

**4. 模型缺失**
- 工作流所需模型需预先下载到 ComfyUI 的 `models/` 目录
- 参考工作流内的 Model links 或 MarkdownNote 说明

## 最佳实践

1. **执行目录**：始终从项目根目录执行，确保相对路径正确
2. **超时设置**：图片生成默认 600 秒，视频生成建议 900 秒以上
3. **工作流选择**：根据需求选择合适工作流（文生图、图生图、视频等）
4. **结果位置**：生成文件在 `work_dir/comfyui_output/<会话名>/`，便于查找和管理