Axiomata Skill Evaluator Zh

Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。双评估系统：(1) Axioma 5维框架（结构、清晰度、完整性、一致性、功能性），(2) ISO 25010结构框架（13项自动检查，目标90%+）。自包含：捆绑 evaluator.py 和 eval-skill.py。适用于：发布前评估技能、根据评估结果改进技能、使用自动分析检查技能质量、进行技能审计、验证技能是否达到生产标准。

Audits

Pass

ClawScanPass

Agentic behavior and permission review.

Static analysisPass

Pattern checks against bundled files.

VirusTotalPass

Multi-engine malware detections and file reputation.

Install

openclaw skills install axiomata-skill-evaluator-zh

Axiomata 技能评估系统 v3.0

通用、非人格化的 OpenClaw 代理技能质量评估工具。

信息	值
版本	3.0.0
类型	自包含评估系统
评估	双评估（Axioma 5维 + ISO 25010）
目标	70+（Axioma），90%+（ISO 25010）

1. 目的和范围

目标

使用双评估系统提供完整的技能质量评估：

Axioma 5维框架（100分）
ISO 25010结构框架（13项自动检查）

设计原则

自包含 + 通用 + 非人格化

原则	描述
自包含	所有工具捆绑在技能目录内
通用	适用于任何 OpenClaw 代理
非人格化	无代理特定引用

使用时机

触发词	行动
评估技能	运行双评估
发布前检查	运行完整评估流程
改进技能	分析报告并修复问题
技能审计	执行完整审计
检查质量	运行自动检查

2. 双评估系统

╔═══════════════════════════════════════════════════════════╗
║              双评估系统架构                            ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  1. Axioma 5维评估（100分）                      │      ║
║  │                                                 │      ║
║  │  维度：                                         │      ║
║  │  ├─ 结构（Structure）     → 20%                 │      ║
║  │  ├─ 清晰度（Clarity）     → 20%                 │      ║
║  │  ├─ 完整性（Completeness） → 20%               │      ║
║  │  ├─ 一致性（Consistency） → 20%                │      ║
║  │  └─ 功能性（Functionality） → 20%              │      ║
║  │                                                 │      ║
║  │  目标：70+ 分数                                 │      ║
║  └─────────────────────────────────────────────────┘      ║
║                        ↓                                ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  2. ISO 25010 结构检查（13项）                 │      ║
║  │                                                 │      ║
║  │  类别：8个类别，25项标准                       │      ║
║  │  自动检查：13项测试                            │      ║
║  │                                                 │      ║
║  │  目标：90%+（12/13项通过）                    │      ║
║  └─────────────────────────────────────────────────┘      ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝

评估流程

[输入] 待评估技能
          ↓
 第一阶段：Axioma 5维评估
          ↓
 第二阶段：ISO 25010结构检查
          ↓
 [输出] 质量报告 + 改进建议

3. 捆绑工具

文件	系统	用途
`evaluator.py`	Axioma 5维	5维评估，捆绑在此目录
`eval-skill.py`	ISO 25010	自动结构检查，捆绑在此目录

工具路径

EVAL_PATH="<技能目录>/scripts/"
SKILL_PATH="<待评估技能>"

# Axioma 5维评估
python3 ${EVAL_PATH}evaluator.py <SKILL_PATH> --verbose

# ISO 25010检查
python3 ${EVAL_PATH}eval-skill.py <SKILL_PATH> --verbose

4. Axioma 5维评估

4.1 维度分解

维度	最高分	目标	检查内容
结构	20	14+	标题头、章节、格式、元数据
清晰度	20	14+	描述、命令、示例、约束
完整性	20	14+	工具、前提条件、错误、边界情况
一致性	20	14+	命名、格式、结构、风格
功能性	20	14+	可验证命令、文档化输出

4.2 分数阈值

分数	状态	行动
90-100	优秀	可投入生产
70-89	良好	可进行小幅改进
50-69	需要改进	需要重大改进
<50	较差	需要重写

5. ISO 25010 结构检查

5.1 自动检查（13项）

类别	检查数	验证内容
结构	6	前置matter、标题头、章节、格式
触发词	2	描述长度、触发上下文
文档	3	正文长度、引用、链接文档
脚本	2	Python解析、无外部依赖

5.2 通过阈值

结果	含义
13/13	完美结构分数
11-12/13	可接受，有轻微警告
<11/13	需要结构改进

6. 命令参考

6.1 Axioma 5维评估

# 基本评估
python3 <技能目录>/scripts/evaluator.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose

# 自动改进建议
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose --improve

# JSON输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --json

6.2 ISO 25010检查

# 基本ISO检查
python3 <技能目录>/scripts/eval-skill.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --verbose

# JSON输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --json

6.3 评估所有技能

# 评估父目录中的所有技能
python3 <技能目录>/scripts/evaluator.py --all

# 详细输出所有
python3 <技能目录>/scripts/evaluator.py --all --verbose

7. 输出格式

7.1 控制台输出

=== 评估结果 ===
结构（STRUCTURE）       20/20 ████████████████████ 100%
清晰度（CLARITY）       17/20 █████████████████░░░ 85%
完整性（COMPLETENESS）  14/20 ████████████░░░░░░░░ 70%
一致性（CONSISTENCY）   10/20 ██████████░░░░░░░░░ 50%
功能性（FUNCTIONALITY） 12/20 ████████████░░░░░░░░ 60%
------------------------------------------------------------
状态：良好（分数 73%）

7.2 JSON输出

{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": [
    "[CONSISTENCY] 低分 (50%)",
    "  -> 风格分数: 2/5"
  ]
}

8. 示例

示例1：基本评估

$ python3 evaluator.py /path/to/skill --verbose
读取 /path/to/skill/SKILL.md (2048 字符)
结构（Structure）: 20/20
清晰度（Clarity）: 17/20
完整性（Completeness）: 14/20
一致性（Consistency）: 10/20
功能性（Functionality）: 12/20
============================================================
状态：良好（分数 73%）

示例2：ISO 25010检查

$ python3 eval-skill.py /path/to/skill --verbose
【结构】（STRUCTURE）
    通过：5/6
【触发词】（TRIGGER）
    通过：2/2
【文档】（DOCUMENTATION）
    通过：2/3
【脚本】（SCRIPTS）
    通过：2/2
【安全】（SECURITY）
    通过：2/2
==================================================
  通过：13  警告：0  失败：0
  结构分数：100%（13/13项通过）

示例3：JSON输出

$ python3 evaluator.py /path/to/skill --json
{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": []
}

9. 自我评估

技能自动进行自我评估：

# 自我评估（未提供路径时评估自身目录）
python3 evaluator.py

# v3.0预期输出：
# 分数：85+/100
# 状态：良好到优秀

10. 建议格式

当维度得分低于70%时：

[{维度}] 低分 ({百分比}%)
  -> {具体问题}
  -> {具体问题}

示例：

[一致性] 低分 (50%)
  -> 集群对齐部分：2
  -> 风格：2/5

11. 约束条件

约束	描述	优先级
70%最低分数	技能必须在Axioma 5维上获得70+分	高
90%+结构分数	ISO 25010检查目标90%+	高
自包含	所有工具捆绑，无外部依赖	高
非人格化	无代理特定引用	高

质量阈值

系统	最低	目标
Axioma 5维	70/100	90/100
ISO 25010	11/13	13/13
结构	14/20	18/20
清晰度	14/20	18/20
完整性	14/20	18/20
一致性	14/20	18/20
功能性	14/20	18/20

12. 错误处理

错误	原因	解决方案
未找到SKILL.md	文件缺失	先创建SKILL.md
解析错误	文件损坏	检查文件编码
模块未找到	缺少依赖	仅使用捆绑工具

13. 工作流集成

╔═══════════════════════════════════════════════════════════╗
║         技能发布工作流                                    ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  1. 创建技能                                              ║
║      ↓                                                    ║
║  2. 自我评估                                              ║
║      ↓ 70+ → 继续                                        ║
║  3. ISO 25010检查                                        ║
║      ↓ 90%+ → 继续                                       ║
║  4. 如有需要则修复问题                                    ║
║      ↓                                                    ║
║  5. 发布到ClawHub                                        ║
║                                                           ║
║  结果：高质量的生产就绪技能                               ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝

In Altum Per Qualitatem. 🧪 AXIOMATA 技能评估系统 v3.0 — 通用质量系统