Install
openclaw skills install orchestration-reviewer-skill对现有工作流计划(Plan IR)进行结构化评审,输出评审结论、问题清单和修订建议。 Use when user asks to 评审工作流计划、审查DAG、审核编排方案、review plan IR、 检查计划合理性、对比多个编排版本、自动评审工作流. 不适用于从零生成新计划/单步操作/纯文本任务。
openclaw skills install orchestration-reviewer-skill对已有工作流计划(Plan IR)进行结构化评审,判断其是否满足业务目标、 是否具备可执行性与治理合理性,输出明确评审结论和修订建议。
核心定位:不从零生成计划,而是面向已有编排结果进行审查、评分和修订。
不覆盖:从零生成计划、运行时调度/重试/补偿、执行结果担保。
| 用户说的 | 是否适用 | 说明 |
|---|---|---|
| "帮我审一下这个执行计划" | ✅ | 调用本 Skill |
| "这个DAG编排合理吗" | ✅ | 调用本 Skill |
| "对比两个版本的计划哪个更好" | ✅ | 调用本 Skill |
| "从零帮我规划一个流程" | ❌ | 用 workflow-orchestration-skill |
| "直接执行这个任务" | ❌ | 单步操作,不需要评审 |
{
"business_goal": "需要编排的业务目标",
"existing_plan_ir": { "nodes": [...], "edges": [...], ... },
"available_skills_manifest": [...],
"review_mode": "review_only",
"constraints": { "max_nodes": 20, "max_depth": 5 }
}
可选字段:review_preferences(strictness_level / require_scorecard / prefer_minimal_change)。
阶段一:输入规范化
阶段二:静态结构校验
python3 scripts/validate_schema.py --plan plan.json
python3 scripts/validate_topology.py --plan plan.json
python3 scripts/validate_scope.py --plan plan.json
阶段三:语义评审(LLM 主导) 从 7 个维度评审:目标一致性、拓扑合理性、技能绑定、作用域安全、 可执行性、效率与复杂度、风险与治理。
阶段四:结论生成 输出 overall_decision + scorecard + issues + suggested_actions。
阶段五:可选修订
当 review_mode = "review_and_revise" 时生成 revised_plan_ir + diff_report。
# 1. 评审(仅 review)
python3 scripts/review_plan.py \
--goal "新员工入职流程" \
--plan plan.json \
--manifest skills_manifest.json \
--mode review_only \
--output review_result.json
# 2. 评审 + 修订
python3 scripts/review_plan.py \
--goal "新员工入职流程" \
--plan plan.json \
--manifest skills_manifest.json \
--mode review_and_revise \
--output review_result.json
# 3. 独立评分
python3 scripts/score_plan.py --plan plan.json --manifest skills.json --output score.json
# 4. 差异对比
python3 scripts/diff_plan.py --original v1.json --revised v2.json --output diff.json
| 维度 | 检查内容 |
|---|---|
| 目标一致性 | 计划是否覆盖 business_goal 所需关键步骤 |
| 拓扑合理性 | 依赖关系是否合理,有无冗余串行、错误前置、不可达节点 |
| 技能绑定 | target_skill 是否与节点职责匹配 |
| 作用域安全 | scoped_state_keys 是否遵循最小权限 |
| 可执行性 | 计划是否可被工作流引擎稳定消费 |
| 效率与复杂度 | 有无冗余节点、可并行未并行、复杂度过高 |
| 风险与治理 | 高风险技能、缺少人工确认点、敏感数据暴露 |
| 结论 | 含义 |
|---|---|
| pass | 计划合理,可进入执行 |
| conditional_pass | 基本合理,需按建议修正后执行 |
| reject | 计划不合理,不建议执行 |
| insufficient_information | 信息不足,无法判断 |
| 级别 | 含义 |
|---|---|
| critical | 阻断性问题,必须修复(如循环依赖、技能不在白名单) |
| major | 重要问题,强烈建议修复(如可并行未并行) |
| minor | 次要问题,建议优化(如命名不规范) |
| info | 信息提示(如全局状态引用) |
business_goal 和 existing_plan_iravailable_skills_manifest 或等价技能元数据pip install jsonschema networkx pydantic deepdiff
orchestration-reviewer-skill/
├── SKILL.md
├── references/
│ ├── review-manual.md
│ ├── review-rules.md
│ ├── scoring-policy.md
│ └── security-guardrails.md
├── scripts/
│ ├── review_plan.py
│ ├── validate_schema.py
│ ├── validate_topology.py
│ ├── validate_scope.py
│ ├── score_plan.py
│ └── diff_plan.py
└── assets/
├── input_schema.json
├── output_schema.json
├── sample_review_input.json
└── sample_review_output.json