盘古·skill

盘古 · skill - 将知识库/文件夹/单文档蒸馏为专业可安装的Skill。 支持四种蒸馏模式:完整知识库、指定文件夹、单篇文档、任务工作流。

Audits

Pass

Install

openclaw skills install pangu

盘古 · skill

「知识库是图书馆,Skill 是专家」——把你的知识库从「被动查询」变成「主动能力」。

本 Skill 借鉴了 女娲 · Skill 的成熟经验,采用多阶段流程 + 检查点设计 + 质量验证标准,非常感谢。


💡 最佳使用场景:IMA Copilot

本技能在 IMA Copilot 中使用效果最佳。

为什么? IMA 本身就是知识库笔记软件——你在 IMA 中积累的笔记、文档、知识库,正是本技能蒸馏的原料。整个工作流无缝衔接:

IMA 知识库(原始积累)
    ↓ 盘古 蒸馏
可安装的 Skill(结构化能力)
    ↓ 安装到 IMA Copilot
触发关键词 → 自动执行完整工作流

在 IMA 中使用本技能的完整流程:

  1. 在 IMA Copilot 中对话,说「盘古」或「蒸馏知识库」
  2. 按提示提供知识库名称和需求
  3. 本技能自动读取 IMA 知识库内容并蒸馏
  4. 生成可安装的 Skill 文件
  5. 将 Skill 安装回 IMA,即可重复使用

💎 精髓:IMA 负责「积累知识」,盘古负责「提炼能力」,形成知识增强闭环。


核心理念

维度知识库Skill
使用方式搜索 → 读取 → 理解触发关键词 → 自动执行
知识形态原始文档(散装)结构化流程 + 精炼规则
门槛需要知道搜什么、怎么问说一句话就触发完整流程
复用性每次都要搜+读+理解安装即用,开箱即得
分发加入知识库 → 问答安装 Skill → 直接用

关键区分:蒸馏的是能做到什么(流程/规则/框架),不是知道什么(信息/文档)。


执行流程

Phase 0: 入口分流

收到用户输入后,先判断蒸馏模式:

模式触发特征示例
完整蒸馏提到知识库名称,未指定范围「把 @XX知识库 蒸馏成 Skill」
文件夹蒸馏指定了文件夹名称「只蒸馏「XX文件夹」里的内容」
单文档蒸馏指定了具体文档「把「XX文档」蒸馏成 Skill」
任务蒸馏提到「刚才的任务」「工作流」「把我刚才做的调研报告流程变成 Skill」

Phase1: 需求澄清

根据蒸馏模式,确认关键信息(参见 references/distillation-best-practices.md 中的完整模板)。

检查知识库是否适合蒸馏

✅ 适合蒸馏❌ 不适合蒸馏
有明确流程/步骤纯数据型(价格表、产品目录)
有规则/规范检查需要频繁更新的实时数据
有分类决策场景纯文献存档(无操作指导)
有方法论/框架一次性查阅的参考资料
有固定输出格式需要专业资质的领域(医疗诊断等)

Phase 1.5: 创建 Skill 目录

收到确认后立即执行,在读取内容之前完成:

{skill-name}/
├── SKILL.md                          # 核心技能文件
├── references/                       # 参考文档(从知识库提炼)
│   ├── 01-core-knowledge.md
│   ├── 02-checklist.md
│   └── 03-cases.md
├── assets/                          # 模板文件(从知识库提取)
└── examples/                        # 使用示例

关键规则:所有参考文件必须存在 skill 目录内部,Skill 必须是自包含的。


Phase 2: 内容读取与分析

读取策略:

  • 完整蒸馏:读取知识库所有文件和文件夹结构
  • 文件夹蒸馏:只读取指定文件夹内的文件
  • 单文档蒸馏:只读取指定的单篇文档
  • 任务蒸馏:分析对话历史,提取完整工作流

对读取的内容进行结构化分析(核心知识提炼、流程提取、案例提取、参考文档识别)。


Phase 2.5: 分析确认检查点

内容读取和分析完成后,暂停展示分析摘要给用户确认,再进入 Phase 3。


Phase 3: 框架提炼

3.1 核心框架提取(3-7个)

  1. 扫描:列出所有候选知识
  2. 筛选:按重要性排序,取 top 3-7 个
  3. 记录格式:每个框架记录——名称、一句话描述、来源证据、应用方式、局限性

3.2-3.5 提炼内容

  • 流程步骤提炼(如有):完成某项任务的具体步骤
  • 检查清单提炼(如有):需要逐项确认的内容
  • 决策规则提炼(如有):做判断时的快速规则
  • 模板提炼(如有):需要生成特定格式内容时的模板

3.6 边界规则

必须明确写出的局限:这个 Skill 不能做什么、在什么情况下不适用、需要人工介入的场景。


Phase 3.5: 提炼确认检查点

Phase 3 提炼完成后,暂停展示提炼摘要给用户确认,再进入 Phase 4。


Phase 4: Skill 构建

将 Phase 3 提炼结果组装为可运行的 SKILL.md。

内容映射规则

知识库内容映射为 Skill 中的
零散的规则/规范规范型 Skill 的检查清单
操作步骤文档流程型 Skill 的 Step 步骤
分类知识任务型 Skill 的决策表
长篇参考文档references/ 目录下的参考文件
模板/范例assets/ 目录下的模板文件
案例/常见问题examples/ 目录下的示例文件

Phase 5: 质量验证

生成 Skill 后,执行以下质量验证:

检查项通过标准不通过信号
核心框架数量3-7 个,每个有来源证据<3 或 >10
每个框架的局限性明确写出失效条件只写优点
流程步骤清晰度用户能按步骤执行步骤模糊或缺失
边界规则完整性至少 2 条具体局限只有「不能替代人工」
示例充分性至少 2 个具体示例没有示例
文档结构完整性所有必要 section 都有有 section 缺失

迭代上限:Phase 3→5 最多循环 2 次。


Phase 6: 双Agent精炼(可选)

Phase 5 验证通过后,可选启动双Agent精炼:

  • Agent A(结构视角):评审结构清晰度和工作流
  • Agent B(用户视角):评审触发关键词和示例

Phase 7: 输出与注册

将生成的 Skill 文件输出,提供注册指引(IMA 中注册:打包zip → 上传 → 等待审核)。


更新已有 Skill

当用户说「更新我的 XX Skill」时:

  1. 读取现有的 SKILL.md,标注更新时间
  2. 只读取变化的部分
  3. 对比新内容与现有内容,增量更新
  4. 不重写整个 Skill

品味守则(速查)

原则一句话
流程 > 知识能执行的流程比散装知识更有价值
规则 > 案例具体规则比一堆案例更容易泛化
边界 > 能力明确边界比夸大能力更诚实
精炼 > 堆砌3 个核心框架远好于 10 个浅薄原则

绝不做的事

  • 把知识库文档原封不动地复制到 Skill 中
  • 蒸馏不适合蒸馏的知识库类型
  • 夸大 Skill 的能力
  • 在信息不足时强行生成完整的 Skill

特殊场景

场景1:知识库内容太多(>100 文件或 50000 字)

建议用户指定蒸馏范围,或分批次蒸馏。

场景2:知识库不适合蒸馏

纯数据型、需要频繁更新的实时数据、纯文献存档、需要专业资质的领域 → 建议保留为知识库。

场景3:跨文件夹引用

保留引用关系,使用相对路径引用 references/ 下的文件。

场景4:蒸馏用户自己的知识库

需要用户明确授权和描述核心知识,注意「自我认知偏差」。

场景5:冷门知识库(<10 篇文档)

框架数量减至 2-3 个,边界规则 section 加大篇幅。


蒸馏示例

完整示例请参考:


小贴士

问题建议
不知道技能名称怎么起?不填,让 AI 自动生成(英文 kebab-case 格式)
不知道触发关键词怎么写?不填,AI 会根据知识库内容自动推断
知识库内容太多?在"重点提炼"中说明哪些必须包含
只想蒸馏部分内容?加一行「蒸馏范围:只提炼「XX」文件夹」
想修改已蒸馏的 Skill?说"更新我的 XX 技能"
想分享给别人?告诉 AI "我需要下载 zip 包"

注意事项

  1. 知识库必须可访问 — 使用 @知识库名称 引用
  2. 不是所有知识库都适合蒸馏 — 纯数据型知识库效果差
  3. 蒸馏后知识库仍保留 — Skill 是知识库的精炼版
  4. 需要审核 — 注册后需等平台审核通过才可使用
  5. 新对话生效 — 审核通过后,在新的对话中才能触发
  6. 内容版权 — 确保你有权蒸馏该知识库的内容

最后

这个 Skill 的目标是:让你知识库中的知识,从「被动等待查询」变成「主动帮你工作」。

一个好的蒸馏 Skill,应该让用户在安装后,只需要说一句话,就能触发完整的工作流——就像有一个专家在旁边指导一样。 蒸馏的是能做到什么(流程/规则/框架),不是知道什么(信息/文档)。

本 Skill 由 盘古 · skill 生成