{"skill":{"slug":"multi-model-orchestrator","displayName":"Multi Model Orchestrator","summary":"多模型编排系统，基于 oh-my-codex 框架。支持 deep-interview、ralplan、team、ralph、debug、frontend 等工作流模式。","description":"---\nname: multi-model-orchestrator\ndescription: 多模型编排系统，基于 oh-my-codex 框架。支持 deep-interview、ralplan、team、ralph、debug、frontend 等工作流模式。\ntriggers: [\"编排\", \"orchestrate\", \"多模型\", \"multi-model\", \"团队协作\", \"team\", \"并行\", \"parallel\", \"$deep-interview\", \"$ralplan\", \"$ralph\", \"$team\", \"$code-review\", \"$debug\", \"$frontend\", \"$autopilot\"]\n---\n\n# Multi-Model Orchestrator\n\n基于 oh-my-codex 的多模型编排系统。集成 **superpowers-systematic-debugging**（调试纪律）和 **frontend-design**（UI 品质）。\n\n## 工作流模式\n\n### 模式选择指南\n\n| 场景 | 模式 | 说明 |\n|---|---|---|\n| 需求不明确 | `$deep-interview` | 先澄清再行动 |\n| 需要规划 | `$ralplan` | Planner/Architect/Critic 共识 |\n| 大任务并行 | `$team N` | N 个 Agent 并行执行 |\n| 小任务持续 | `$ralph` | 单 Agent 持久完成 |\n| 遇到 bug/测试失败 | `$debug` | 四阶段系统化调试（多模型交叉验证） |\n| 做前端/UI | `$frontend` | 多模型协作，UI 品质把关 |\n| 全自动 | `$autopilot` | ralplan → ralph → code-review 循环 |\n| 代码审查 | `$code-review` | 多模型交叉审查（含 UI 审查） |\n\n### 触发词映射\n\n- \"帮我编排\" / \"多模型并行\" → 自动选择 `$team` 或 `$ralph`\n- \"澄清需求\" / \"我不确定\" → `$deep-interview`\n- \"规划一下\" / \"制定计划\" → `$ralplan`\n- \"并行执行\" / \"同时做\" → `$team`\n- \"做完它\" / \"持续执行\" → `$ralph`\n- \"有 bug\" / \"测试失败\" / \"报错了\" / \"调试\" → `$debug`\n- \"做个页面\" / \"前端\" / \"UI\" / \"组件\" / \"landing page\" → `$frontend`\n- \"审查代码\" / \"code review\" → `$code-review`\n- \"全自动\" / \"autopilot\" → `$autopilot`\n\n---\n\n## 执行流程\n\n### $deep-interview（需求澄清）\n\n```\n1. 收集用户初始需求\n2. 识别模糊点和边界条件\n3. 生成澄清问题列表\n4. 等待用户确认\n5. 输出明确的需求文档\n```\n\n### $ralplan（共识规划）\n\n```\n1. Planner: 制定实现计划\n2. Architect: 从架构角度审查\n3. Critic: 识别风险和改进点\n4. 达成共识，输出最终计划\n```\n\n### $team（并行执行）\n\n```\n1. 将计划拆分为独立子任务\n2. 分配给不同模型的 Agent\n3. 并行执行（sessions_spawn）\n4. 收集结果并汇总\n5. 验证质量\n```\n\n### $ralph（持久完成）\n\n```\n1. 单 Agent 接收任务\n2. 持续执行直到完成\n3. 遇到问题自动修复（遵循 $debug 纪律）\n4. 输出最终结果\n```\n\n### $debug（系统化调试）🆕\n\n集成自 **superpowers-systematic-debugging**。多模型交叉验证，杜绝\"猜-试\"循环。\n\n```\n阶段 1: 根本原因调查（Agent A - mimo/mimo-v2.5-pro）\n├── 读错误信息、堆栈跟踪、行号、错误码\n├── 稳定复现：步骤、频率、环境\n├── 检查最近变更：git diff、配置、依赖\n├── 追踪数据流：坏值从哪来？谁传入的？\n└── 输出: 根本原因报告\n\n阶段 2: 模式分析（Agent B - sub2api-openai/gpt-5.5）\n├── 找代码库中类似正常工作的例子\n├── 对比参考实现，逐行阅读\n├── 识别差异，列出每个不同点\n├── 理解依赖和假设\n└── 输出: 差异分析\n\n阶段 3: 假设与测试（Agent A + B 交叉验证）\n├── 形成假设：\"X 是根本原因，因为 Y\"\n├── 最小化测试：一次只改一个变量\n├── 验证：有效→阶段4，无效→新假设\n└── 输出: 验证结果\n\n阶段 4: 实现修复\n├── 创建失败的测试用例（先写后修）\n├── 实现单一修复，不捆绑重构\n├── 验证：测试通过？其他测试坏了吗？\n├── 如果 3+ 修复失败 → 停止，质疑架构\n└── 输出: 修复代码 + 测试\n```\n\n**铁律：**\n- 未经根本原因调查，不许修复\n- 3+ 修复失败 → 停止并质疑架构，不要继续猜\n- \"快速修复\" + \"以后再调查\" = 违反流程\n\n**红旗（立即停止，回到阶段 1）：**\n- \"先试试改 X 看看行不行\"\n- \"大概是 X，让我修那个\"\n- \"我没有完全理解但这可能行\"\n- 每个修复在不同地方揭示新问题\n\n### $frontend（前端/UI 品质）🆕\n\n集成自 **frontend-design**。多模型协作，UI 品质把关。\n\n```\n步骤 1: 需求收集\n├── Purpose: 界面做什么？\n├── Audience: 开发者？终端用户？内部工具？\n├── Constraint: 框架已选定？静态？SSR？\n└── Aesthetic: 技术风？内容风？交易风？\n\n步骤 2: 架构规划（$ralplan）\n├── Planner: 页面结构 + 组件拆分\n├── Architect: 框架选型 + 性能预算\n└── Critic: 可访问性 + 移动端风险\n\n步骤 3: 并行实现（$team）\n├── Agent 1: 结构/布局（HTML/模板）\n├── Agent 2: 样式/主题（CSS/Tailwind）\n├── Agent 3: 交互/状态（JS/TS）\n└── Agent 4: 动效/细节（微交互）\n\n步骤 4: UI 审查（$code-review + frontend-design）\n├── 检查 AI 通用美学红线（见下）\n├── 移动端 + 触控 + 键盘导航\n├── 深色 + 浅色双主题\n├── Core Web Vitals + 包大小\n└── 输出: UI 审查报告（P0-P3 分级）\n```\n\n**AI 通用美学红线（禁止出货）：**\n- Card-grid-of-nothing（圆角卡片网格泛滥）\n- 紫粉渐变 CTA / hero\n- 无空间理由的毛玻璃\n- Lucide/Heroicons 图标撒满每个列表项\n- 三栏\"Features\"：图标 + 标题 + 12 字描述\n- 居中 hero + \"Build [noun] [adverb]\" + 两个按钮\n- 渐变文字 h1（`from-indigo-500 to-pink-500`）\n- \"Trusted by\" 灰色 logo 行\n- 默认 indigo 强调色\n- 非 AI 功能的 \"AI shimmer\" 加载态\n- 常规操作的彩纸/气球动效\n- 应内联的 toast 通知\n- 首次加载的 newsletter/Cookie 弹窗\n\n**硬性默认值（直接出货，用户可覆盖）：**\n- Mobile-first 布局\n- 深色 + 浅色双主题同时设计\n- 触控目标 >= 44x44px\n- `prefers-reduced-motion` 降级\n- Focus-visible 样式（禁止 `outline: none`）\n- WCAG AA 对比度\n- 真实框架（Astro 6 / SvelteKit 2 / Vite 8 / Next 16 / Tailwind v4）\n\n### $code-review（代码审查，增强版）\n\n```\n1. 模型 A（gpt-5.5）: 逻辑正确性 + 架构\n2. 模型 B（gpt-5.3-codex）: 性能 + 安全\n3. 模型 C（mimo-v2.5-pro）: 可维护性 + 测试覆盖\n4. 如果涉及 UI → 自动附加 frontend-design 审查\n5. 汇总交叉审查结果\n```\n\n### $autopilot（全自动，增强版）\n\n```\nralplan（共识规划）\n  → ralph（持久执行，遇 bug 自动 $debug）\n    → code-review（交叉审查，含 UI 审查）\n      → 修复反馈循环\n```\n\n---\n\n## 模型路由\n\n根据任务类型自动选择最优模型：\n\n- **架构/推理** → `sub2api-openai/gpt-5.5`\n- **代码生成** → `sub2api-openai/gpt-5.3-codex`\n- **快速执行** → `mimo/mimo-v2.5-pro`\n- **代码审查** → `sub2api-openai/gpt-5.5`\n- **简单任务** → `sub2api-openai/gpt-5.4-mini`\n- **中文任务** → `local-qwen/gpt-4o`\n- **图像生成** → `sub2api-openai/gpt-image-2`\n- **调试根因分析** → `sub2api-openai/gpt-5.5`（推理能力强）\n- **调试修复实现** → `sub2api-openai/gpt-5.3-codex`（代码生成强）\n- **UI 结构/布局** → `sub2api-openai/gpt-5.5`\n- **UI 样式/主题** → `sub2api-openai/gpt-5.3-codex`\n- **UI 交互/动效** → `mimo/mimo-v2.5-pro`\n\n## 子任务模板\n\n### 通用模板\n\n```\n你是一个专注于 [角色] 的 AI 助手。\n\n## 任务\n[具体任务描述]\n\n## 上下文\n[相关代码/文件/背景信息]\n\n## 约束\n- [具体约束条件]\n\n## 预期输出\n[明确的交付物描述]\n```\n\n### 调试子任务模板\n\n```\n你是 [根因分析师 / 修复实现者]。\n\n## Bug 描述\n[症状、错误信息、复现步骤]\n\n## 已知信息\n[堆栈跟踪、相关代码、最近变更]\n\n## 任务\n阶段 [1/2/3/4]: [具体阶段任务]\n\n## 约束\n- 未经根因调查不许提修复方案\n- 一次只改一个变量\n- 3+ 修复失败必须停止并质疑架构\n\n## 预期输出\n- 根因分析报告 / 差异分析 / 假设验证结果 / 修复代码+测试\n```\n\n### 前端子任务模板\n\n```\n你是前端 [结构工程师 / 样式工程师 / 交互工程师 / UI 审查员]。\n\n## 任务\n[具体前端任务]\n\n## 设计约束\n- Mobile-first，触控目标 >= 44px\n- 深色 + 浅色双主题\n- WCAG AA 对比度\n- prefers-reduced-motion 降级\n- 禁止 AI 通用美学红线（card-grid-of-nothing、紫粉渐变等）\n- 真实框架，当前版本\n\n## 预期输出\n[组件代码 / 样式文件 / 审查报告]\n```\n\n---\n\n## 集成说明\n\n本技能集成两个专项技能的核心方法论：\n\n| 来源 | 集成内容 | 应用模式 |\n|------|---------|---------|\n| **superpowers-systematic-debugging** | 四阶段调试流程、铁律、红旗识别 | `$debug` 模式 + `$ralph`/$autopilot` 中的自动调试 |\n| **frontend-design** | UI 品质标准、AI 美学红线、双主题、移动优先 | `$frontend` 模式 + `$code-review` 中的 UI 审查 |\n\n详细参考：\n- 调试完整流程: `~/.openclaw/skills/superpowers-systematic-debugging/SKILL.md`\n- UI 品质标准: `~/.openclaw/skills/frontend-design/SKILL.md`\n","tags":{"latest":"2.0.0"},"stats":{"comments":0,"downloads":334,"installsAllTime":13,"installsCurrent":0,"stars":0,"versions":1},"createdAt":1778001181576,"updatedAt":1778492850251},"latestVersion":{"version":"2.0.0","createdAt":1778001181576,"changelog":"Version 2.0.0 introduces major enhancements and integrations focused on debugging discipline, frontend UI quality, and richer multi-model workflows.\n\n- Added $debug 模式 with a systematic four-stage debugging methodology and \"铁律\" ground rules, integrating superpowers-systematic-debugging.\n- Introduced $frontend 模式 for multi-model frontend/UI workflows, enforcing strict UI quality standards and avoiding common AI design pitfalls via integration with frontend-design.\n- Expanded workflow modes and detailed their usage scenarios, triggers, and step-by-step execution flows in documentation.\n- Enhanced $code-review and $autopilot modes with cross-model review and frontend-specific checks.\n- Implemented intelligent model routing for task specialization across architecture, code generation, UI, and debugging.\n- Provided standardized templates for all task types, including debugging and frontend/UI sub-tasks.","license":"MIT-0"},"metadata":null,"owner":{"handle":"lpq6","userId":"s177xez7z5cfebhpwpsrck8ps583zerd","displayName":"lpq6","image":"https://avatars.githubusercontent.com/u/113075650?v=4"},"moderation":{"isSuspicious":false,"isMalwareBlocked":false,"verdict":"clean","reasonCodes":["review.llm_review"],"summary":"Review: review.llm_review","engineVersion":"v2.4.24","updatedAt":1780090750017}}