🏛️ 多模型决策委员会
专为 OpenClaw 设计的"数字智库",通过多模型独立评审与共识合成,消除单模型偏见,为复杂决策提供客观参考。
📋 版本变更记录
| 版本 | 日期 | 更新内容 |
|---|
| V1.0.0 | 2026-04-19 | 初始版本,包含核心框架、3轮收敛机制、6段式报告 |
| V1.1.0 | 2026-04-24 | 新增英文操作文档(与中文合并,英文在上);经多模型委员会翻译质量审核通过(均分81/100) |
| V1.1.3 | 2026-04-24 | SKILL.md和references/转为纯中文(精简);docs/保留双语完整文档(面向全球用户) |
| V1.2.0 | 2026-04-25 | 恢复为公共ClawHub版本(曾为本地定制版);同步所有文件 |
| V1.2.1 | 2026-04-25 | 关键修复:删除SKILL.md中硬编码的模型列表(A1/A2/A4...);改为执行时动态扫描本地openclaw.json的models.providers生成实时模型列表;示例中的模型引用改为通用占位符[模型A/B/C] |
| V1.2.2 | 2026-04-25 | 同步:v1.2.1热修复后全文件同步到GitHub和ClawHub |
| V1.2.3 | 2026-04-25 | 用户体验修复:明确首次使用流程:自动扫描模型 → 默认前3个 → 提示用户确认或修改评委后再开始决策 |
| V1.2.4 | 2026-04-25 | 关键修复:OUTPUT_TEMPLATE.md - 删除所有3轮prompt模板中的「匿名委员」,改为「{模型名称}(实名委员)」格式 |
| V1.2.5 | 2026-04-25 | 强制判定机制:SKILL.md - 新增「强制判定规则」章节,明确 Round 1/2 后的阈值判定和收敛判定为不可跳过步骤;禁止行为新增跳项判定禁止规则 |
| V1.2.6 | 2026-04-25 | 严禁引导提示修订:任务下发时不得针对评审委员设置诱导性提示词或诱导性身份角色;第0轮准备阶段;三层架构;100分制评分 |
| V1.5.0 | 2026-04-25 | 同步所有文档版本号至V1.5.0,与USER_GUIDE保持一致 |
| V1.5.1 | 2026-04-26 | 新增「每轮开始前通知用户」规则;新增「收敛分差阈值」可配置参数;新增「异常处理规则」章节 |
| V1.5.2 | 2026-04-26 | 新增「判定方式」可配置参数,明确全票通过制为默认判定规则 |
| V1.5.6 | 2026-04-26 | 严禁子Agent委托:评委严禁spawn子Agent,只能独立思考输出结论;复杂任务由组织者拆解分发;删除原「结论收敛原则」避免歧义 |
🎯 插件定位
多模型决策委员会 是专为 OpenClaw 设计的"数字智库"。它支持调动多个不同架构的大模型(如 GPT、Gemini、豆包等)同时对同一任务进行协同思考、对抗辩论与共识合成,有效消除单模型偏见,综合性给出最优建议。
核心优势
- 去中心化决策:交叉验证不同模型逻辑,确保方案的严谨性。
- 对抗性评审:通过模型间的互评,快速锁定潜在的逻辑漏洞。
- 弹性扩容:根据任务难度,随时增加或减少"决策委员"的数量。
- 消除偏见:多模型独立评审,避免单一AI的认知盲区。
- 量化决策:6维度评分 + 加权矩阵,结论有据可查。
- 透明可信:实名委员制、模型身份透明。
- 灵活配置:参数可调,如决策成员人数、决策轮次、通过阈值等,均可可自定义。
核心治理原则:身份纯净
为了确保结果的绝对客观,本插件强制执行 "身份纯净原则":
- 角色透明化:决策委员会成员均会注明其身份(大模型名称),保持可视化透明。
- 严禁设定角色:禁止给委员设定诸如"架构师"、"审计员"等身份标签。
- 严禁引导提示:任务下发时不得针对评审委员设置诱导性提示词或诱导性身份角色,防止产生的偏见。
- 严禁子Agent委托:评委严禁spawn任何子Agent,只能独立思考和输出结论;禁止二次委托,所有子任务由组织者统一分发和回收,确保链路完全可控
- 评审不重复原则:若组织者(即当前使用模型)是评审委员会成员,则组织者提交内容即视同为其在本轮的评审结果,无需重复自评。若组织者不是评审委员会成员,则仅负责组织实施和汇总评委意见,不参与评审。
使用方法
- 启动:在OpenClaw中,输入指令"启动多模型决策委员会"、"审议这个方案"、"对这个方案进行决策"、"启动决策"即可启动多模型决策委员会。首次使用时会提醒用户进入配置模式,并选择模型组合。
- 配置:根据需要,可配置参数,如:轮数、阈值、委员数量、委员模型等。
参数配置
配置参数可采用指令方式,如:"修改配置"、"调整参数"、"增加委员"、"确认配置"。
| 指令关键词 | 可调参数 | 说明 |
|---|
| "换模型" | 委员模型组合 | 从用户本地接入的模型列表中选择模型组合加入 |
| "改轮数" | 决策轮数 | 默认3轮,日常事务可设为2轮,重大决策可设3-6轮 |
| "收敛分差阈值" | 收敛判定分差 | 收敛判定时,允许的最大分差范围,默认5分;分差内视为无分歧,直接收敛 |
| "改阈值" | 判定阈值 | 通过阈值:默认≥90%;待决策阈值:默认[72%, 90%);否定阈值:默认<72% |
| "改判定方式" | 通过判定方式 | 全票通过(默认):所有评委均需≥阈值;均分通过:评委均分≥阈值;多数票通过:超过半数评委≥阈值 |
| "增加委员" / "减少委员" | 委员数量 | 支持2-6个模型同时评审 |
| "确认配置" | 确认当前配置 | 确认当前参数后开始决策 |
参数建议
- 模型选择:建议至少包含 1 个具备强逻辑推理能力的模型和 1 个具备强中文语境理解能力的模型。
- 轮次建议:日常事务建议 2 轮;涉及架构、资金、核心规则的决策,建议 3-5 轮。
- 阈值设定:
- 严谨型:≥95%(全票通过)
- 效率型:≥75%(多数通过)
决策流程(3轮收敛机制)
多模型决策委员会采用 3 轮收敛机制,每轮进行100分制评分,最终给出决策结果。
第 0 轮:准备阶段 (Preparation)
决策准备:组织者(当前使用模型)接收到决策任务后,将用户背景、需求、待审方案汇总后发起决策申请。内容格式为:
- 项目名称:{项目名称}
- 项目背景:{项目背景}
- 项目需求:{项目需求}
- 待审方案:{待审方案}
- 决策成员:{决策成员:调取已配置的模型组合}
- 决策轮次:{决策轮次:调取已配置的轮数}
- 阈值设置:{阈值设置:调取已配置的阈值}
- 提交决策:{提交用户是否开始决策}
第 1 轮:独立评估 (Blind Evaluation)
动作说明:组织者接收到决策确认后,将准备流程相关内容分发至各选定模型的独立子会话中。每位委员在完全无法感知他方意见的情况下进行背对背评审。
评审维度:方案逻辑合理性、完整性、潜在风险分析、实施资源消耗预估、可行性评审、优化建议,并按照100分值进行评分。
评审时长:不超过3分钟/轮。若3分钟仍未回收所有子会话,组织者将结束流程并返回结果。
核心产出:组织者汇总各委员的初评报告及投票结果及打分结果,以及分歧意见或争议点。
第 2 轮:收敛讨论 (Consensus Sync)
动作说明:组织者汇总总结,对全体委员讨论通过的结果进行封存,不再讨论。提取第一轮中所有未通过的点,并将这些冲突整理为"争议清单"以及"优化建议",再次下发给所有委员,要求评委讨论并重新评价该论点,最终产出第二轮决策结果。
评审时长:不超过3分钟/轮。若3分钟仍未回收所有子会话,组织者将结束流程并返回结果。
核心产出:争议大范围收敛,产出第二轮决策结果。若所有委员均通过决策(无新分歧点),跳过第3轮,直接输出最终报告。若仍然存在分歧点,参照第2轮收敛讨论,继续进行第三轮收敛讨论。
第 3 轮:最终辩论 (Final Duel)
动作说明:组织者汇总总结,对全体委员讨论通过的结果进行封存,不再讨论。针对极少数无法通过讨论对齐的"深层冲突点",再次下发给所有委员,要求评委讨论并重新评价该论点,最终产出最终决策结果。
评审时长:不超过3分钟/轮。若3分钟仍未回收所有子会话,组织者将结束流程并返回结果。
核心产出:争议大范围收敛,产出最终决策结果。若仍然存在分歧点,按照简化为"是/否"或"路径A/路径B"的对立选项,要求所有委员进行最后一轮逻辑立场表态。生成最终量化投票矩阵,并自动生成 6 段式标准决策报告。
轮次扩展说明
| 扩展类型 | 说明 |
|---|
| 增加轮次(4轮及以上) | 第4轮参照"收敛讨论"循环收敛,第5轮参照"最终辩论"输出投票矩阵,以此类推 |
| 减少轮次(3轮以下) | 第1轮参照"独立评估",第2轮直接输出最终报告 |
自动化通知规则
为防止评委评审时间过长导致用户对当前状态不知情,组织者必须在每轮评审开始前主动通知用户:
- 进入第1轮:通知用户「各位评委已开始独立评估,请稍候」
- 进入第2轮:通知用户「各位评委已开始收敛讨论,请稍候」
- 进入第3轮:通知用户「各位评委已开始最终辩论,请稍候」
- 进入收敛判定:通知用户「评委意见已收敛,正在生成最终报告」
强制判定规则
每轮结束后必须进行判定,不可跳过。
判定方式(默认全票通过制):
- 全票通过(默认):所有评委评分均需达到阈值,任一评委低于阈值即判定为不通过
- 均分通过:所有评委的平均分达到阈值即判定为通过
- 多数票通过:超过半数的评委评分达到阈值即判定为通过
收敛判定规则:
| 轮次 | 判定类型 | 规则 |
|---|
| Round 1 结束后 | 收敛判定 | 汇总所有评委评分,若推荐顺序完全一致且评分差距在「收敛分差阈值」内 → 收敛,直接输出最终报告 |
| Round 2 结束后 | 收敛判定 | 汇总所有评委评分,若推荐顺序完全一致 → 收敛,跳过 Round 3 |
| 任意轮超限 | 超时处理 | 3分钟未回收所有评委时,组织者标记超时评委,继续处理已返回的评委结果 |
最终输出:6段式共识报告
决策完成后,输出标准化报告,包含:
- 投票记录 — 量化评分矩阵
- 汇总说明 — 各委员核心论点(注明大模型)
- 执行方案 — 结论版 + 说明版
- 未决清单 — 待确认事项与负责人
- 结论摘要 — 一句话裁定 + 置信度
- 风险提示 — 主要风险与缓解建议
异常处理规则
以下3类异常的处理标准:
| 异常类型 | 处理标准 |
|---|
| 状态同步错误 | 组织者检测到状态文件与实际流程不符时,应立即中止当前流程,通知用户并提示重新发起决策 |
| 规则执行偏差 | 组织者在执行中发现某委员的评审结果违反本skill规定的流程(如跳轮、跳过收敛判定等),应要求该委员重新按规则执行,不得擅自修改委员结论 |
| 超时处理 | 单轮超过3分钟仍有评委未返回结果时,组织者对超时评委标记「超时-未提交」,以已返回的评委结果进行汇总和判定 |
技术约束
- 每个子会话最大执行时间:60秒
- 最大并发子会话数:13个
- 状态文件有效期:24小时
- 报告自动归档路径:
~/.openclaw/workspace/memory/MONTHLY/mmd_<date>.md
参考文档
🏛️ 兼听则明,万模共鉴。