Install
openclaw skills install axiomata-skill-evaluator-zhAxiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。 双评估系统:(1) Axioma 5维框架(结构、清晰度、完整性、一致性、功能性),(2) ISO 25010结构框架(13项自动检查,目标90%+)。 自包含:捆绑 evaluator.py 和 eval-skill.py。 适用于:发布前评估技能、根据评估结果改进技能、使用自动分析检查技能质量、进行技能审计、验证技能是否达到生产标准。
openclaw skills install axiomata-skill-evaluator-zh通用、非人格化的 OpenClaw 代理技能质量评估工具。
| 信息 | 值 |
|---|---|
| 版本 | 3.0.0 |
| 类型 | 自包含评估系统 |
| 评估 | 双评估(Axioma 5维 + ISO 25010) |
| 目标 | 70+(Axioma),90%+(ISO 25010) |
使用双评估系统提供完整的技能质量评估:
自包含 + 通用 + 非人格化
| 原则 | 描述 |
|---|---|
| 自包含 | 所有工具捆绑在技能目录内 |
| 通用 | 适用于任何 OpenClaw 代理 |
| 非人格化 | 无代理特定引用 |
| 触发词 | 行动 |
|---|---|
| 评估技能 | 运行双评估 |
| 发布前检查 | 运行完整评估流程 |
| 改进技能 | 分析报告并修复问题 |
| 技能审计 | 执行完整审计 |
| 检查质量 | 运行自动检查 |
╔═══════════════════════════════════════════════════════════╗
║ 双评估系统架构 ║
╠═══════════════════════════════════════════════════════════╣
║ ║
║ ┌─────────────────────────────────────────────────┐ ║
║ │ 1. Axioma 5维评估(100分) │ ║
║ │ │ ║
║ │ 维度: │ ║
║ │ ├─ 结构(Structure) → 20% │ ║
║ │ ├─ 清晰度(Clarity) → 20% │ ║
║ │ ├─ 完整性(Completeness) → 20% │ ║
║ │ ├─ 一致性(Consistency) → 20% │ ║
║ │ └─ 功能性(Functionality) → 20% │ ║
║ │ │ ║
║ │ 目标:70+ 分数 │ ║
║ └─────────────────────────────────────────────────┘ ║
║ ↓ ║
║ ┌─────────────────────────────────────────────────┐ ║
║ │ 2. ISO 25010 结构检查(13项) │ ║
║ │ │ ║
║ │ 类别:8个类别,25项标准 │ ║
║ │ 自动检查:13项测试 │ ║
║ │ │ ║
║ │ 目标:90%+(12/13项通过) │ ║
║ └─────────────────────────────────────────────────┘ ║
║ ║
╚═══════════════════════════════════════════════════════════╝
[输入] 待评估技能
↓
第一阶段:Axioma 5维评估
↓
第二阶段:ISO 25010结构检查
↓
[输出] 质量报告 + 改进建议
| 文件 | 系统 | 用途 |
|---|---|---|
evaluator.py | Axioma 5维 | 5维评估,捆绑在此目录 |
eval-skill.py | ISO 25010 | 自动结构检查,捆绑在此目录 |
EVAL_PATH="<技能目录>/scripts/"
SKILL_PATH="<待评估技能>"
# Axioma 5维评估
python3 ${EVAL_PATH}evaluator.py <SKILL_PATH> --verbose
# ISO 25010检查
python3 ${EVAL_PATH}eval-skill.py <SKILL_PATH> --verbose
| 维度 | 最高分 | 目标 | 检查内容 |
|---|---|---|---|
| 结构 | 20 | 14+ | 标题头、章节、格式、元数据 |
| 清晰度 | 20 | 14+ | 描述、命令、示例、约束 |
| 完整性 | 20 | 14+ | 工具、前提条件、错误、边界情况 |
| 一致性 | 20 | 14+ | 命名、格式、结构、风格 |
| 功能性 | 20 | 14+ | 可验证命令、文档化输出 |
| 分数 | 状态 | 行动 |
|---|---|---|
| 90-100 | 优秀 | 可投入生产 |
| 70-89 | 良好 | 可进行小幅改进 |
| 50-69 | 需要改进 | 需要重大改进 |
| <50 | 较差 | 需要重写 |
| 类别 | 检查数 | 验证内容 |
|---|---|---|
| 结构 | 6 | 前置matter、标题头、章节、格式 |
| 触发词 | 2 | 描述长度、触发上下文 |
| 文档 | 3 | 正文长度、引用、链接文档 |
| 脚本 | 2 | Python解析、无外部依赖 |
| 结果 | 含义 |
|---|---|
| 13/13 | 完美结构分数 |
| 11-12/13 | 可接受,有轻微警告 |
| <11/13 | 需要结构改进 |
# 基本评估
python3 <技能目录>/scripts/evaluator.py <技能路径>
# 详细输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose
# 自动改进建议
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose --improve
# JSON输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --json
# 基本ISO检查
python3 <技能目录>/scripts/eval-skill.py <技能路径>
# 详细输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --verbose
# JSON输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --json
# 评估父目录中的所有技能
python3 <技能目录>/scripts/evaluator.py --all
# 详细输出所有
python3 <技能目录>/scripts/evaluator.py --all --verbose
=== 评估结果 ===
结构(STRUCTURE) 20/20 ████████████████████ 100%
清晰度(CLARITY) 17/20 █████████████████░░░ 85%
完整性(COMPLETENESS) 14/20 ████████████░░░░░░░░ 70%
一致性(CONSISTENCY) 10/20 ██████████░░░░░░░░░ 50%
功能性(FUNCTIONALITY) 12/20 ████████████░░░░░░░░ 60%
------------------------------------------------------------
状态:良好(分数 73%)
{
"skill": "example-skill",
"scores": {
"structure": 20,
"clarity": 17,
"completeness": 14,
"consistency": 10,
"functionality": 12
},
"total": 73,
"max": 100,
"passed": true,
"recommendations": [
"[CONSISTENCY] 低分 (50%)",
" -> 风格分数: 2/5"
]
}
$ python3 evaluator.py /path/to/skill --verbose
读取 /path/to/skill/SKILL.md (2048 字符)
结构(Structure): 20/20
清晰度(Clarity): 17/20
完整性(Completeness): 14/20
一致性(Consistency): 10/20
功能性(Functionality): 12/20
============================================================
状态:良好(分数 73%)
$ python3 eval-skill.py /path/to/skill --verbose
【结构】(STRUCTURE)
通过:5/6
【触发词】(TRIGGER)
通过:2/2
【文档】(DOCUMENTATION)
通过:2/3
【脚本】(SCRIPTS)
通过:2/2
【安全】(SECURITY)
通过:2/2
==================================================
通过:13 警告:0 失败:0
结构分数:100%(13/13项通过)
$ python3 evaluator.py /path/to/skill --json
{
"skill": "example-skill",
"scores": {
"structure": 20,
"clarity": 17,
"completeness": 14,
"consistency": 10,
"functionality": 12
},
"total": 73,
"max": 100,
"passed": true,
"recommendations": []
}
技能自动进行自我评估:
# 自我评估(未提供路径时评估自身目录)
python3 evaluator.py
# v3.0预期输出:
# 分数:85+/100
# 状态:良好到优秀
当维度得分低于70%时:
[{维度}] 低分 ({百分比}%)
-> {具体问题}
-> {具体问题}
示例:
[一致性] 低分 (50%)
-> 集群对齐部分:2
-> 风格:2/5
| 约束 | 描述 | 优先级 |
|---|---|---|
| 70%最低分数 | 技能必须在Axioma 5维上获得70+分 | 高 |
| 90%+结构分数 | ISO 25010检查目标90%+ | 高 |
| 自包含 | 所有工具捆绑,无外部依赖 | 高 |
| 非人格化 | 无代理特定引用 | 高 |
| 系统 | 最低 | 目标 |
|---|---|---|
| Axioma 5维 | 70/100 | 90/100 |
| ISO 25010 | 11/13 | 13/13 |
| 结构 | 14/20 | 18/20 |
| 清晰度 | 14/20 | 18/20 |
| 完整性 | 14/20 | 18/20 |
| 一致性 | 14/20 | 18/20 |
| 功能性 | 14/20 | 18/20 |
| 错误 | 原因 | 解决方案 |
|---|---|---|
| 未找到SKILL.md | 文件缺失 | 先创建SKILL.md |
| 解析错误 | 文件损坏 | 检查文件编码 |
| 模块未找到 | 缺少依赖 | 仅使用捆绑工具 |
╔═══════════════════════════════════════════════════════════╗
║ 技能发布工作流 ║
╠═══════════════════════════════════════════════════════════╣
║ ║
║ 1. 创建技能 ║
║ ↓ ║
║ 2. 自我评估 ║
║ ↓ 70+ → 继续 ║
║ 3. ISO 25010检查 ║
║ ↓ 90%+ → 继续 ║
║ 4. 如有需要则修复问题 ║
║ ↓ ║
║ 5. 发布到ClawHub ║
║ ║
║ 结果:高质量的生产就绪技能 ║
║ ║
╚═══════════════════════════════════════════════════════════╝
In Altum Per Qualitatem. 🧪 AXIOMATA 技能评估系统 v3.0 — 通用质量系统