{"skill":{"slug":"skill-reviewer-2","displayName":"Skill Reviewer","summary":"审核/审查 Skill 代码质量的专业工具。当用户说\"检查 skill\"、\"审核 skill\"、\"review {名称} skill\"、\"skill 写得怎么样\"、\"帮我看看这个 skill 有什么问题\"时使用。依据 Anthropic 官方指南进行结构验证、YAML 前置信息检查、描述质量评估、指令完整性审查，...","description":"---\nname: skill-reviewer\ndescription: 审核/审查 Skill 代码质量的专业工具。当用户说\"检查 skill\"、\"审核 skill\"、\"review {名称} skill\"、\"skill 写得怎么样\"、\"帮我看看这个 skill 有什么问题\"时使用。依据 Anthropic 官方指南进行结构验证、YAML 前置信息检查、描述质量评估、指令完整性审查，并输出详细的问题报告和改进建议。\n---\n\n# Skill Reviewer\n\n> **说明**：这是一个Skill审核工具，用于审核其他技能的质量。文档中包含的\"错误示例\"（如无效 YAML、错误命名等）仅用于教学演示，展示不应该怎么写。不存在任何恶意或混淆代码。\n\n依据 Anthropic 官方 Skills 开发指南，对技能进行全面审核。提供结构化审核框架、评分系统、缺陷检查清单和改进建议。\n\n## 核心职责\n\n1. **结构验证** - 检查文件夹结构、文件命名规范\n   > 示例：`ls skills/my-skill/` 检查 `SKILL.md` 是否存在\n2. **YAML 审核** - 验证前置信息格式和必填字段\n   > 示例：`head -20 SKILL.md` 检查 name/description\n3. **描述评估** - 检查触发条件是否清晰\n   > 示例：description 应包含\"当用户...时\"触发条件\n4. **组织评分** - 评估技能是否按任务组织、常见操作优先\n   > 示例：\"## 编码和解码\" ✅ vs \"## 理论\" ❌\n5. **指令审查** - 评估主体指令的质量和完整性\n   > 示例：是否有工作流程、示例、错误处理\n6. **示例质量** - 评估示例密度和可执行性\n   > 示例：每 5-30 行 1 个代码块为最佳密度\n7. **Tips 评分** - 评估技巧部分的质量和价值\n   > 示例：5-10 条非显而易见的实用技巧\n8. **最佳实践** - 对照官方指南检查合规性\n   > 示例：检查是否按任务组织而非抽象概念\n\n## 工作流程\n\n### 第 1 步：接收审核请求\n\n当用户请求审核 skill 时：\n\n1. 确认 skill 文件夹路径或读取 SKILL.md 内容\n2. 判断审核严格程度：\n\n**严格模式（必须读取完整版官方指南）：**\n当用户表达以下意图时，必须先读取 `references/anthropic-skills-development-guide.md` 完整版指南：\n- 明确要求\"严格检查\"、\"仔细审核\"、\"全面审查\"\n- 提到\"高质量要求\"、\"生产级别\"、\"发布前检查\"\n- 表达\"不想有任何遗漏\"、\"按最高标准\"\n- 用于团队/组织/公司项目\n- 准备公开发布或分享给他人\n\n**常规模式：**\n- 优先读取 `references/checklist.md`（快速检查清单）\n- 遇到疑问或边缘案例时读取完整版官方指南\n\n---\n\n### 第 2 步：结构检查\n\n**文件夹结构验证：**\n```text\n[ ] 技能文件夹使用 kebab-case 命名（如 my-skill）\n[ ] SKILL.md 存在且命名精确（区分大小写）\n[ ] 无 README.md 在技能文件夹内\n[ ] 可选文件夹（如存在）命名规范\n```\n\n**可选文件夹命名规范（如存在）：**\n- [ ] `scripts/` - 全小写复数，无空格/下划线\n- [ ] `references/` - 全小写复数，无空格/下划线\n- [ ] `assets/` - 全小写复数，无空格/下划线\n\n**❌ 错误示例：** `Scripts`、`script`、`scripts_backup`、`References`、`refs`、`Assets`、`asset_files`\n\n**示例：检查文件夹结构**\n```bash\n# 查看技能文件夹结构\nls -la skills/china-holidays/\n```\n**预期输出：**\n```text\nskills/china-holidays/\n├── SKILL.md          # ✅ 正确：精确命名\n└── references/       # ✅ 正确：全小写复数\n    └── calendar-guide.md\n```\n\n**评分：__/4**\n\n---\n\n### 第 3 步：YAML 前置信息检查\n\n**必填字段验证：**\n```text\n[ ] name 字段存在，kebab-case，无空格大写\n[ ] description 字段存在，非空\n[ ] YAML 分隔符完整（--- 开头和结尾）\n[ ] 无 XML 标签（< >）\n[ ] name 不以 claude/anthropic 开头\n```\n\n**示例：验证 YAML 前置信息**\n```bash\n# 读取前 20 行检查 YAML\nhead -20 skills/china-holidays/SKILL.md\n```\n**预期输出（正确示例）：**\n```yaml\n---\nname: china-holidays\ndescription: 获取中国国家法定节假日安排。当用户询问\"放假安排\"、\"节假日\"时使用。\n---\n```\n**错误示例（应该拒绝）：**\n```yaml\nname: ChinaHolidays        # ❌ 大写，应该 kebab-case\nname: claude-scheduler     # ❌ 以 claude 开头\ndescription: \"\"            # ❌ 空描述\n<skill>                    # ❌ 包含 XML 标签\n```\n\n**Description 质量评分（满分 8 分）：**\n```text\n[2] 开头说明做什么（主动动词）\n    好：\"分析 Figma 设计文件并生成开发者交接文档\"\n    差：\"这是关于 Figma 的技能\"\n\n[2] 包含触发条件（\"当用户...时\"）\n    好：\"当用户上传 .fig 文件或询问设计规格时使用\"\n    差：无触发条件\n\n[2] 具体范围（提及具体工具、操作或场景）\n    好：\"Figma 设计文件、.fig、组件文档、设计交接\"\n    差：\"帮助处理项目\"\n\n[2] 合理长度（50-200 字符，不超过 1024）\n    太短：无搜索价值\n    太长：被截断\n```\n\n**评分：__/8**\n\n---\n\n### 第 4 步：组织评分\n\n**按任务/场景组织（而非按抽象概念）：**\n```text\n[2] 按任务/操作组织章节\n    好：\"## 编码和解码\" → \"## 检查字符\" → \"## 转换格式\"\n    差：\"## 理论\" → \"## 类型\" → \"## 高级\"\n\n[2] 常见操作优先\n    好：基础用法 → 变体 → 高级 → 边界情况\n    差：配置说明 → 理论背景 → 最后才是基础用法\n\n[1] 章节自包含（可独立使用）\n\n[1] 深度一致（不混用 h2 与 h4 随机跳转）\n```\n\n**评分：__/6**\n\n---\n\n### 第 5 步：主体指令检查\n\n**必须包含：**\n```text\n[ ] 清晰的工作流程或步骤说明\n[ ] 至少一个使用示例\n[ ] 错误处理或故障排查指南\n```\n\n**推荐包含（不扣分）：**\n```text\n[ ] 预期输出说明\n[ ] 多个场景示例\n[ ] 参考文档链接\n[ ] \"使用场景\" 或 \"When to Use\" 部分\n```\n\n**评分：__/6**\n\n---\n\n### 第 6 步：示例质量评估\n\n**示例密度计算：**\n```text\n总行数：___\n代码块数量：___\n密度：每 ___ 行 1 个代码块\n\n参考目标：每 5-30 行 1 个代码块\n< 5 行/块：可能过于碎片化（短命令集或多命令速查除外）\n> 40 行/块：需要更多示例\n```\n\n**示例密度评分：**\n```text\n[3] 密度在 5-30 行/块范围内\n[2] 密度略低（30-40 行/块）或略高（3-5 行/块）\n[0] 密度严重不足（>40 行/块）或过高（<3 行/块）\n```\n\n**每个示例质量评分（0-3 分）：**\n```text\n[ ] 语言标签正确（```bash, ```python 等）\n[ ] 语法正确，命令可执行\n[ ] 展示了预期输出或结果说明\n[ ] 使用真实值（非 foo/bar/baz）\n[ ] 无占位符（TODO, FIXME, xxx）\n[ ] 自包含或有设置说明\n\n0 分：broken 或有误导性\n1 分：可用但简陋（无输出/上下文）\n2 分：良好（正确，有输出或说明）\n3 分：优秀（可直接复制，真实，覆盖边界）\n```\n\n**示例质量得分 = 所有示例平均分 × 密度分 / 3 = __/9**\n\n---\n\n### 第 7 步：可执行性评估\n\n核心问题：Agent 能否按照这些指令产生正确结果？\n\n```text\n[3] 使用祈使句（\"运行 X\"、\"创建 Y\"）\n    非：\"可以考虑...\"或\"建议...\"或\"You might...\"\n\n[3] 步骤顺序合理（前置条件在行动之前）\n\n[2] 错误处理（说明失败时怎么做）\n\n[2] 输出/结果描述（如何验证成功）\n```\n\n**评分：__/10**\n\n---\n\n### 第 8 步：渐进式披露检查\n\n```text\n[ ] SKILL.md 控制在 500 行以内\n    500-600 行：给出提醒，不扣分\n    超过 600 行：扣分\n[ ] 详细文档是否在 `references/` 中\n[ ] 大文件（>300 行）有目录或结构说明\n```\n\n**评分：__/3**\n\n---\n\n### 第 9 步：Tips 评分\n\n**技巧部分质量评估：**\n\n```text\n[2] 5-10 条技巧\n    少于 5 条：覆盖不足\n    多于 10 条：可能不够精炼\n\n[2] 技巧非显而易见\n    好：\"Makefile 头号陷阱：缩进必须用 Tab，不能用空格\"\n    差：\"确保测试你的代码\"\n\n[2] 技巧具体可执行\n    好：\"使用 flock 防止 cron 任务重叠执行\"\n    差：\"小心并发执行\"\n\n[1] 技巧不矛盾主体内容\n\n[1] 技巧覆盖特定主题的陷阱/踩坑点\n```\n\n**评分：__/8**\n\n---\n\n### （可选）Metadata 参考\n\n> 仅当 skill 包含 metadata 字段时检查，仅供参考，不计分\n\n```text\n[ ] emoji 与技能主题相关\n[ ] requires.anyBins 列出技能实际使用的工具（非 generic 如 bash）\n[ ] os 数组准确（不包含不支持的平台）\n[ ] JSON 格式有效\n```\n\n---\n\n## 评分总结\n\n```text\nSKILL 审核评分卡\n═══════════════════════════════════════\n技能名称：{name}\n审核者：{agent/human}\n日期：{date}\n审核模式：{严格/常规}\n\n类别                  得分     满分\n─────────────────────────────────────\n结构检查              __       4\nDescription 质量       __       8\n组织评分              __       6\n主体指令              __       6\n示例质量              __       9\n可执行性              __      10\n渐进式披露            __       3\nTips 评分             __       8\n─────────────────────────────────────\n总分                  __      54\n\n转换为百分制：总分 × 1.85 = ___/100\n\n评级：\n  85+  优秀 — 可直接发布\n  70-84 良好 — 需要小改进\n  50-69 一般 — 需要明显改进\n  < 50  较差 — 需要重大修改\n\n结论：{PUBLISH / REVISE / REWORK}\n```\n\n---\n\n## 常见缺陷\n\n### 严重缺陷（阻止发布）\n\n```text\n缺陷：YAML 前置信息无效\n检测：YAML 解析错误、缺少必填字段\n修复：验证 YAML 格式，确保 name/description 都存在\n\n缺陷：代码示例损坏\n检测：语法错误、未定义变量、错误参数\n修复：在干净环境中测试每个命令\n\n缺陷：工具要求不匹配（如存在 metadata）\n检测：requires 列出内容未在内容中使用\n修复：grep 内容提取命令名，更新 requires 匹配\n\n缺陷：误导性描述\n检测：描述承诺的内容实际未覆盖\n修复：使描述与实际内容一致，或补充缺失内容\n```\n\n### 主要缺陷（发布前应该修复）\n\n```text\n缺陷：缺少\"使用场景\"部分\n影响：Agent 不知道何时激活技能\n修复：添加 4-8 条触发场景说明\n\n缺陷：大段文字无示例\n检测：任何超过 10 行无代码块的章节\n修复：为每个概念添加具体示例\n\n缺陷：示例缺少语言标签\n检测：\\`\\`\\` 后无语言标识符\n修复：为每个代码块添加 bash/python/javascript/yaml 等\n\n缺陷：缺少 Tips/技巧部分\n影响：缺少使技能有价值的经验总结\n修复：添加 5-10 条非显而易见的实用技巧\n\n缺陷：按抽象概念组织\n检测：章节名为\"理论\"、\"概述\"、\"背景\"、\"介绍\"\n修复：按任务/操作重组：用户要做什么\n```\n\n### 次要缺陷（建议修复）\n\n```text\n缺陷：占位符值\n检测：foo, bar, baz, example.com, TODO, FIXME\n修复：替换为真实值\n\n缺陷：格式不一致\n检测：混合标题级别、代码块样式不一致\n修复：统一标题层次和格式\n\n缺陷：缺少交叉引用\n检测：提到其他技能覆盖的工具/概念但未引用\n修复：添加\"参见 X 技能了解更多\"注释\n\n缺陷：过时的命令\n检测：旧语法或已弃用工具\n修复：更新为当前工具版本和语法\n```\n\n---\n\n## 快速审核模板\n\n当不需要完整评分时的快速审核：\n\n```markdown\n## 快速审核：{skill-name}\n\n**结构**：[通过/问题：...]\n**Description**：[强/弱：原因]\n**示例**：[X 个代码块，共 Y 行 — 密度 正常/低/高]\n**可执行性**：[Agent 可以/不可以 遵循这些指令，因为...]\n**首要缺陷**：[最应该修复的单一问题]\n**评分**：__/100\n**结论**：[PUBLISH / REVISE / REWORK]\n```\n\n---\n\n## 审核工作流\n\n### 发布前自查\n\n```bash\n# 1. 验证 YAML 前置信息\nhead -20 skills/my-skill/SKILL.md\n# 目视确认 YAML 有效\n\n# 2. 统计代码块数量\ngrep -c '```' skills/my-skill/SKILL.md\n# 总行数除以这个数得密度\n\n# 3. 检查占位符\ngrep -n -i 'todo\\|fixme\\|xxx\\|foo\\|bar\\|baz' skills/my-skill/SKILL.md\n\n# 4. 检查缺失语言标签\ngrep -n '^```$' skills/my-skill/SKILL.md\n# 每个代码块都应该有语言标签\n\n# 5. 验证工具要求匹配内容（如存在 metadata）\n# 提取 requires，然后 grep 内容检查每个工具\n\n# 6. 测试命令（抽样 3-5 个）\n# 在干净 shell 中运行验证\n\n# 7. 运行评分卡\n# 目标：良好 35+，优秀 45+\n```\n\n**示例：完整审核报告输出**\n```markdown\n## 审核报告：china-holidays\n\n**结构**：✅ 通过 - kebab-case 命名，SKILL.md 存在\n**Description**：✅ 强 - 包含触发条件和具体场景\n**示例**：18 个代码块，524 行 — 密度 正常 (29 行/块)\n**可执行性**：✅ 可以遵循 - 9 步清晰工作流程\n\n**评分总结**：\n─────────────────────────────────────\n结构检查              4        4\nDescription 质量       8        8\n组织评分              6        6\n主体指令              6        6\n示例质量              7        9\n可执行性              10       10\n渐进式披露            3        3\nTips 评分             8        8\n─────────────────────────────────────\n总分                  52       54\n百分制：96/100\n\n**结论**：PUBLISH - 可直接发布\n```\n\n### 审核他人技能\n\n```bash\n# 安装技能（如适用）\nnpx molthub@latest install skill-name\n\n# 阅读内容\ncat skills/skill-name/SKILL.md\n\n# 运行快速审核模板\n# 如分数 < 25，考虑卸载并寻找替代\n```\n\n---\n\n## 参考文件\n\n按使用场景分层：\n\n| 文件 | 用途 | 何时读取 |\n|------|------|----------|\n| `references/checklist.md` | 快速检查清单 | 常规审核流程 |\n| `references/official-guide-summary.md` | 精简指南 | 快速查阅常用规范 |\n| `references/anthropic-skills-development-guide.md` | 完整版官方指南 | **严格模式下必须读取**；常规模式下遇到疑问时查阅 |\n\n**严格模式触发条件**（满足任一即触发）：\n- 用户明确要求\"严格检查\"、\"全面审查\"、\"仔细审核\"\n- 提到\"高质量\"、\"生产级别\"、\"发布前\"\n- 表达\"不想有遗漏\"、\"按最高标准\"\n- 用于团队/组织/公司项目\n- 准备公开发布或分享\n\n**审核时先判断模式**：严格模式必须先读取完整版指南再进行审核；常规模式按需查阅。\n\n---\n\n## 示例\n\n### 示例 1：完整审核\n\n**用户说：** \"帮我审核一下这个 skill，路径在 ./skills/china-holidays\"\n\n**操作：**\n1. 读取 `./skills/china-holidays/SKILL.md`\n2. 判断审核模式（默认常规）\n3. 按照评分卡逐项检查\n4. 生成审核报告\n5. 解读结果并提供改进建议\n\n**结果：** 输出完整审核报告，包含问题列表、修改建议和最终评分\n\n### 示例 2：严格模式审核\n\n**用户说：** \"这个 skill 准备发布到团队内部使用，需要严格检查，不能有任何问题\"\n\n**操作：**\n1. 触发严格模式\n2. **必须**先读取 `anthropic-skills-development-guide.md`\n3. 对照官方指南逐项严格检查\n4. 输出详细报告，确保无遗漏\n\n### 示例 3：快速检查 description\n\n**用户说：** \"这个 skill 的 description 写得怎么样？\" + 附上内容\n\n**操作：**\n1. 聚焦 description 字段分析\n2. 使用 8 分评分标准\n3. 提供改进建议\n\n**结果：** 指出问题并提供修改建议\n\n---\n\n## 技巧\n\n- **Description 最重要** — 它占实际影响力的 40% 以上。完美的 skill 配上糟糕的 description 也不会被找到。\n\n- **先数代码块** — 少于 8 个代码块的 skill 几乎总是过于抽象而无用。\n\n- **在干净环境测试 3-5 个命令** — 如超过 1 个失败，说明 skill 发布前未测试。\n\n- **按任务组织 vs 按概念组织** — 这是最关键的结构质量差异。好技能回答\"如何做 X\"，坏技能解释\"X 是什么\"。\n\n- **有好 Tips 但示例弱的 skill，比有好示例但没 Tips 的更有价值** — Tips 编码了示例无法传达的专业知识。\n\n- **检查 requires 与实际使用是否匹配** — 常见缺陷是列出 bash（所有都有）而不是实际工具如 docker、curl、jq。\n\n- **过短的 skill（<150 行）通常不值得发布** — 它们提供的价值不如快速网络搜索。如果 skill 太短，可能是更大 skill 的一个章节。\n\n- **最佳标准：你自己会收藏使用吗** — 如果你自己不会用，就不要发布。\n","tags":{"latest":"0.1.0"},"stats":{"comments":0,"downloads":513,"installsAllTime":0,"installsCurrent":0,"stars":0,"versions":1},"createdAt":1773320159434,"updatedAt":1778491857969},"latestVersion":{"version":"0.1.0","createdAt":1773320159434,"changelog":"Initial release of Skill Reviewer: a comprehensive skill audit tool following Anthropic guidelines.\n\n- Provides structured review framework, scoring system, defect checklist, and improvement suggestions.\n- Covers folder structure, YAML front-matter, description quality, organization, command instructions, example density and quality, execution readiness, progressive disclosure, and tips evaluation.\n- Includes scoring sheet (max 54 pts), rating tiers, and detailed reporting templates.\n- Supports strict and normal audit modes based on user intent.\n- Offers quick review template and self-check workflow for skill authors.","license":"MIT-0"},"metadata":null,"owner":{"handle":"binbin1213","userId":"s175t2nj3jefb6dwtqr6ymcca583j74w","displayName":"彬彬哦","image":"https://avatars.githubusercontent.com/u/32067712?v=4"},"moderation":null}