Hermes AGI 指令迭代 & 执行监督 Skill
核心定位
解决AGI系统的三大顽疾:
- 指令模糊 → 不可执行
- 缺乏校验 → 不了了之
- 无奖惩机制 → 没有反馈
本skill将任何模糊的AGI指令,变成可测量、可执行、可迭代的闭环系统。
目录结构
hermes-agi-supervisor/
├── SKILL.md # 主说明文件(本文件)
├── scripts/
│ ├── decompose.sh # 任务分解脚本
│ └── score.sh # 积分计算脚本
└── _meta.json # 元数据
快速开始
用户输入任务指令后,按以下四步执行:
第一步:任务分解(AI执行 + 脚本记录)
用户输入:
我要:提升客户满意度
AI执行完整分解,输出结构化任务清单后,使用脚本记录:
# 在终端执行(由AI自动调用)
./scripts/decompose.sh "提升客户满意度"
生成结构化任务文件,记录到 ~/.hermes/tasks/
四大模块
模块一:指令拆解(Decompose)
输入: 一条模糊的AGI指令
输出: 拆解为3-7条具体、可测量、可验证的子任务
拆解标准:
- 每条子任务必须可以回答"做到了"或"没做到"
- 每条子任务必须有明确的完成标志
- 每条子任务必须有时限或触发条件
输入示例:"提升客户满意度"
↓ 拆解输出
① 提取最近30条客户评价(完成标志:30条数据)
② 识别负向关键词频率TOP5(完成标志:词频表)
③ 生成改进建议清单(完成标志:清单≥5条)
④ 制定改进优先级(完成标志:带理由的排序)
⑤ 输出可执行的SOP(完成标志:含时间节点)
模块二:奖惩机制设定(Incentive Design)
输入: 拆解后的子任务列表
输出: 每条任务的奖惩规则(积分制)
奖惩规则:
- 按时完成 +10分,超时1次 -5分
- 完成质量达到标准 +20分,被打回重做 -10分
- 连续3次达标触发"正向加速"(任务难度升级)
- 连续2次未达标触发"强制降级"(简化任务粒度)
输出格式:
| 子任务 | 完成标志 | 奖励 | 惩罚 | 状态 |
|--------|----------|------|------|------|
| 任务1 | | | | 待执行 |
模块三:执行校验(Verification)
输入: 子任务完成结果
输出: 合格/不合格/需重写 三个判定
判定规则:
- 合格: 完成标志全部达成,内容无明显错误
- 不合格: 完成标志部分达成,或存在事实性错误
- 需重写: 完成标志全部达成,但不符合质量标准(需调整表述/结构/深度)
积分计算(自动):
./scripts/score.sh <task_id> <完成数> <失败数>
# 输出:{"task_id": "xxx", "base_score": 15, "bonus": 10, "total": 25, "status": "good"}
特殊处理:
- 如果任务结果为"我不会/无法完成" → 触发指令降级
- 如果任务结果为"已完成,但不确定质量" → 触发自检流程
模块四:指令重写(Rewrite)
输入: 不合格或需重写的任务结果 + 原始指令
输出: 优化后的新指令 + 改进说明
重写策略:
- 增加具体限定词(时间/数量/标准/格式)
- 拆解复合指令为串行步骤
- 移除主观性词汇("做好一点"/"差不多就行")
- 添加验证节点(中期检查点)
原始指令:"了解一下市场"
↓ 重写后
"在3个平台(知乎/抖音/得到)搜索'AI工具'关键词,
各抓取20条高赞内容,整理为包含:标题/平台/点赞数/核心观点
的Excel表,于24小时内完成。"
闭环流程
用户输入模糊指令
↓
【模块一】拆解 → 子任务清单
↓
【模块二】设定奖惩 → 积分表
↓
用户/系统执行子任务
↓
【模块三】校验结果
↓
合格?→ 下一任务
不合格?→ 【模块四】重写 → 重新执行
↓
全部完成 → 输出总结报告(含积分累计)
使用方式
标准流程(完整四步):
直接输入你的AGI指令,格式示例:
我要:提升团队执行力
单独调用某一模块:
- "拆解 + 你的指令" → 只执行模块一
- "校验 + 任务结果" → 只执行模块三
- "重写 + 模糊指令" → 只执行模块四
脚本说明
| 脚本 | 作用 | 调用方式 |
|---|
decompose.sh | 创建任务文件,记录原始指令 | bash scripts/decompose.sh "<指令>" |
score.sh | 计算任务积分和状态 | bash scripts/score.sh <task_id> <完成数> <失败数> |
任务文件保存在 ~/.hermes/tasks/ 目录,支持历史查询。
注意事项
- 本skill不替代执行,只负责监督和优化
- 奖惩积分系统需用户自行维护(可用笔记或表格)
- 连续3次无法完成的子任务,建议降级或拆分粒度
- 任务文件采用JSON格式存储,支持程序化读取和分析