Axiomata Skill Evaluator Zh

Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。 双评估系统:(1) Axioma 5维框架(结构、清晰度、完整性、一致性、功能性),(2) ISO 25010结构框架(13项自动检查,目标90%+)。 自包含:捆绑 evaluator.py 和 eval-skill.py。 适用于:发布前评估技能、根据评估结果改进技能、使用自动分析检查技能质量、进行技能审计、验证技能是否达到生产标准。

Audits

Pass

Install

openclaw skills install axiomata-skill-evaluator-zh

Axiomata 技能评估系统 v3.0

通用、非人格化的 OpenClaw 代理技能质量评估工具。

信息
版本3.0.0
类型自包含评估系统
评估双评估(Axioma 5维 + ISO 25010)
目标70+(Axioma),90%+(ISO 25010)

1. 目的和范围

目标

使用双评估系统提供完整的技能质量评估:

  1. Axioma 5维框架(100分)
  2. ISO 25010结构框架(13项自动检查)

设计原则

自包含 + 通用 + 非人格化
原则描述
自包含所有工具捆绑在技能目录内
通用适用于任何 OpenClaw 代理
非人格化无代理特定引用

使用时机

触发词行动
评估技能运行双评估
发布前检查运行完整评估流程
改进技能分析报告并修复问题
技能审计执行完整审计
检查质量运行自动检查

2. 双评估系统

╔═══════════════════════════════════════════════════════════╗
║              双评估系统架构                            ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  1. Axioma 5维评估(100分)                      │      ║
║  │                                                 │      ║
║  │  维度:                                         │      ║
║  │  ├─ 结构(Structure)     → 20%                 │      ║
║  │  ├─ 清晰度(Clarity)     → 20%                 │      ║
║  │  ├─ 完整性(Completeness) → 20%               │      ║
║  │  ├─ 一致性(Consistency) → 20%                │      ║
║  │  └─ 功能性(Functionality) → 20%              │      ║
║  │                                                 │      ║
║  │  目标:70+ 分数                                 │      ║
║  └─────────────────────────────────────────────────┘      ║
║                        ↓                                ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  2. ISO 25010 结构检查(13项)                 │      ║
║  │                                                 │      ║
║  │  类别:8个类别,25项标准                       │      ║
║  │  自动检查:13项测试                            │      ║
║  │                                                 │      ║
║  │  目标:90%+(12/13项通过)                    │      ║
║  └─────────────────────────────────────────────────┘      ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝

评估流程

[输入] 待评估技能
          ↓
 第一阶段:Axioma 5维评估
          ↓
 第二阶段:ISO 25010结构检查
          ↓
 [输出] 质量报告 + 改进建议

3. 捆绑工具

文件系统用途
evaluator.pyAxioma 5维5维评估,捆绑在此目录
eval-skill.pyISO 25010自动结构检查,捆绑在此目录

工具路径

EVAL_PATH="<技能目录>/scripts/"
SKILL_PATH="<待评估技能>"

# Axioma 5维评估
python3 ${EVAL_PATH}evaluator.py <SKILL_PATH> --verbose

# ISO 25010检查
python3 ${EVAL_PATH}eval-skill.py <SKILL_PATH> --verbose

4. Axioma 5维评估

4.1 维度分解

维度最高分目标检查内容
结构2014+标题头、章节、格式、元数据
清晰度2014+描述、命令、示例、约束
完整性2014+工具、前提条件、错误、边界情况
一致性2014+命名、格式、结构、风格
功能性2014+可验证命令、文档化输出

4.2 分数阈值

分数状态行动
90-100优秀可投入生产
70-89良好可进行小幅改进
50-69需要改进需要重大改进
<50较差需要重写

5. ISO 25010 结构检查

5.1 自动检查(13项)

类别检查数验证内容
结构6前置matter、标题头、章节、格式
触发词2描述长度、触发上下文
文档3正文长度、引用、链接文档
脚本2Python解析、无外部依赖

5.2 通过阈值

结果含义
13/13完美结构分数
11-12/13可接受,有轻微警告
<11/13需要结构改进

6. 命令参考

6.1 Axioma 5维评估

# 基本评估
python3 <技能目录>/scripts/evaluator.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose

# 自动改进建议
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose --improve

# JSON输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --json

6.2 ISO 25010检查

# 基本ISO检查
python3 <技能目录>/scripts/eval-skill.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --verbose

# JSON输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --json

6.3 评估所有技能

# 评估父目录中的所有技能
python3 <技能目录>/scripts/evaluator.py --all

# 详细输出所有
python3 <技能目录>/scripts/evaluator.py --all --verbose

7. 输出格式

7.1 控制台输出

=== 评估结果 ===
结构(STRUCTURE)       20/20 ████████████████████ 100%
清晰度(CLARITY)       17/20 █████████████████░░░ 85%
完整性(COMPLETENESS)  14/20 ████████████░░░░░░░░ 70%
一致性(CONSISTENCY)   10/20 ██████████░░░░░░░░░ 50%
功能性(FUNCTIONALITY) 12/20 ████████████░░░░░░░░ 60%
------------------------------------------------------------
状态:良好(分数 73%)

7.2 JSON输出

{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": [
    "[CONSISTENCY] 低分 (50%)",
    "  -> 风格分数: 2/5"
  ]
}

8. 示例

示例1:基本评估

$ python3 evaluator.py /path/to/skill --verbose
读取 /path/to/skill/SKILL.md (2048 字符)
结构(Structure): 20/20
清晰度(Clarity): 17/20
完整性(Completeness): 14/20
一致性(Consistency): 10/20
功能性(Functionality): 12/20
============================================================
状态:良好(分数 73%)

示例2:ISO 25010检查

$ python3 eval-skill.py /path/to/skill --verbose
【结构】(STRUCTURE)
    通过:5/6
【触发词】(TRIGGER)
    通过:2/2
【文档】(DOCUMENTATION)
    通过:2/3
【脚本】(SCRIPTS)
    通过:2/2
【安全】(SECURITY)
    通过:2/2
==================================================
  通过:13  警告:0  失败:0
  结构分数:100%(13/13项通过)

示例3:JSON输出

$ python3 evaluator.py /path/to/skill --json
{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": []
}

9. 自我评估

技能自动进行自我评估:

# 自我评估(未提供路径时评估自身目录)
python3 evaluator.py

# v3.0预期输出:
# 分数:85+/100
# 状态:良好到优秀

10. 建议格式

当维度得分低于70%时:

[{维度}] 低分 ({百分比}%)
  -> {具体问题}
  -> {具体问题}

示例:

[一致性] 低分 (50%)
  -> 集群对齐部分:2
  -> 风格:2/5

11. 约束条件

约束描述优先级
70%最低分数技能必须在Axioma 5维上获得70+分
90%+结构分数ISO 25010检查目标90%+
自包含所有工具捆绑,无外部依赖
非人格化无代理特定引用

质量阈值

系统最低目标
Axioma 5维70/10090/100
ISO 2501011/1313/13
结构14/2018/20
清晰度14/2018/20
完整性14/2018/20
一致性14/2018/20
功能性14/2018/20

12. 错误处理

错误原因解决方案
未找到SKILL.md文件缺失先创建SKILL.md
解析错误文件损坏检查文件编码
模块未找到缺少依赖仅使用捆绑工具

13. 工作流集成

╔═══════════════════════════════════════════════════════════╗
║         技能发布工作流                                    ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  1. 创建技能                                              ║
║      ↓                                                    ║
║  2. 自我评估                                              ║
║      ↓ 70+ → 继续                                        ║
║  3. ISO 25010检查                                        ║
║      ↓ 90%+ → 继续                                       ║
║  4. 如有需要则修复问题                                    ║
║      ↓                                                    ║
║  5. 发布到ClawHub                                        ║
║                                                           ║
║  结果:高质量的生产就绪技能                               ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝

In Altum Per Qualitatem. 🧪 AXIOMATA 技能评估系统 v3.0 — 通用质量系统