Orchestration Reviewer Skill

Other

对现有工作流计划（Plan IR）进行结构化评审，输出评审结论、问题清单和修订建议。 Use when user asks to 评审工作流计划、审查DAG、审核编排方案、review plan IR、检查计划合理性、对比多个编排版本、自动评审工作流. 不适用于从零生成新计划/单步操作/纯文本任务。

Install

openclaw skills install orchestration-reviewer-skill

Orchestration Reviewer Skill v1.0

对已有工作流计划（Plan IR）进行结构化评审，判断其是否满足业务目标、是否具备可执行性与治理合理性，输出明确评审结论和修订建议。

核心定位：不从零生成计划，而是面向已有编排结果进行审查、评分和修订。

功能范围

评审 Plan IR 与 business_goal 的对齐度
检查拓扑、节点职责、技能绑定、作用域声明
输出明确结论：pass / conditional_pass / reject / insufficient_information
输出评分卡（scorecard）和问题清单（issues）
可选修订：生成 revised_plan_ir + diff_report

不覆盖：从零生成计划、运行时调度/重试/补偿、执行结果担保。

使用

决策路由

用户说的	是否适用	说明
"帮我审一下这个执行计划"	✅	调用本 Skill
"这个DAG编排合理吗"	✅	调用本 Skill
"对比两个版本的计划哪个更好"	✅	调用本 Skill
"从零帮我规划一个流程"	❌	用 workflow-orchestration-skill
"直接执行这个任务"	❌	单步操作，不需要评审

调用输入

{
  "business_goal": "需要编排的业务目标",
  "existing_plan_ir": { "nodes": [...], "edges": [...], ... },
  "available_skills_manifest": [...],
  "review_mode": "review_only",
  "constraints": { "max_nodes": 20, "max_depth": 5 }
}

可选字段：review_preferences（strictness_level / require_scorecard / prefer_minimal_change）。

五阶段流程

阶段一：输入规范化

解析 business_goal、existing_plan_ir、available_skills_manifest

阶段二：静态结构校验

python3 scripts/validate_schema.py --plan plan.json
python3 scripts/validate_topology.py --plan plan.json
python3 scripts/validate_scope.py --plan plan.json

阶段三：语义评审（LLM 主导） 从 7 个维度评审：目标一致性、拓扑合理性、技能绑定、作用域安全、可执行性、效率与复杂度、风险与治理。

阶段四：结论生成 输出 overall_decision + scorecard + issues + suggested_actions。

阶段五：可选修订 当 review_mode = "review_and_revise" 时生成 revised_plan_ir + diff_report。

完整调用示例

# 1. 评审（仅 review）
python3 scripts/review_plan.py \
  --goal "新员工入职流程" \
  --plan plan.json \
  --manifest skills_manifest.json \
  --mode review_only \
  --output review_result.json

# 2. 评审 + 修订
python3 scripts/review_plan.py \
  --goal "新员工入职流程" \
  --plan plan.json \
  --manifest skills_manifest.json \
  --mode review_and_revise \
  --output review_result.json

# 3. 独立评分
python3 scripts/score_plan.py --plan plan.json --manifest skills.json --output score.json

# 4. 差异对比
python3 scripts/diff_plan.py --original v1.json --revised v2.json --output diff.json

补充说明

评审维度（7 维）

维度	检查内容
目标一致性	计划是否覆盖 business_goal 所需关键步骤
拓扑合理性	依赖关系是否合理，有无冗余串行、错误前置、不可达节点
技能绑定	target_skill 是否与节点职责匹配
作用域安全	scoped_state_keys 是否遵循最小权限
可执行性	计划是否可被工作流引擎稳定消费
效率与复杂度	有无冗余节点、可并行未并行、复杂度过高
风险与治理	高风险技能、缺少人工确认点、敏感数据暴露

结论判定

结论	含义
pass	计划合理，可进入执行
conditional_pass	基本合理，需按建议修正后执行
reject	计划不合理，不建议执行
insufficient_information	信息不足，无法判断

问题严重级别

级别	含义
critical	阻断性问题，必须修复（如循环依赖、技能不在白名单）
major	重要问题，强烈建议修复（如可并行未并行）
minor	次要问题，建议优化（如命名不规范）
info	信息提示（如全局状态引用）

前置条件

已提供 business_goal 和 existing_plan_ir
已提供 available_skills_manifest 或等价技能元数据
不满足前置条件时返回结构化错误

安全规则

评审结果仅作为治理与决策依据，不自动触发执行
高风险修订建议要求人工复核
修订结果必须再次通过静态校验

依赖

pip install jsonschema networkx pydantic deepdiff

目录结构

orchestration-reviewer-skill/
├── SKILL.md
├── references/
│   ├── review-manual.md
│   ├── review-rules.md
│   ├── scoring-policy.md
│   └── security-guardrails.md
├── scripts/
│   ├── review_plan.py
│   ├── validate_schema.py
│   ├── validate_topology.py
│   ├── validate_scope.py
│   ├── score_plan.py
│   └── diff_plan.py
└── assets/
    ├── input_schema.json
    ├── output_schema.json
    ├── sample_review_input.json
    └── sample_review_output.json