cms-tbs-knowledge-splitter

Other

知识条目拆分 Skill。将PPTX文档解析为MD,再通过两步法(理解+生成)拆分为结构化知识条目JSON,最终合并去重生成Excel。触发词:拆分知识条目/生成知识条目/知识库构建/构建知识库。

Install

openclaw skills install cms-tbs-knowledge-splitter

cms-tbs-knowledge-splitter

核心定位

本 Skill 只做编排:按 references/stage1-parse.mdreferences/stage2-generate.mdreferences/stage3-merge.md 单主线推进。阶段一 PPTX→MD(文件处理服务);阶段二 MD→知识条目 JSON(两步法);阶段三合并去重 Excel。

适用场景:从培训类 PPTX 系统性构建药品/器械知识库条目。

任务分流(进入链路前先判断意图)

用户意图判断依据处理方式
执行类(拆分/建库)「拆分知识条目」「生成知识库」「构建知识库」等主动动作进入阶段一至三完整链路
咨询类(了解规则/流程)询问用法、流程、分类体系等不执行脚本;结合 SKILL.md 与相关 references/ 说明
排障类(某步失败/结果异常)具体报错、条数不对、Excel 异常等先读 references/pitfalls.md;未覆盖再查 references/failure-examples.md;定向到对应阶段文档;不重置已通过的前置阶段

同一会话内,用户「咨询」后表达执行意图,再切换到执行类。排障不默认重做已完成阶段。

Quick Reference

每步必读(正常执行路径)

阶段必读文档
鉴权(进阶段一前)references/auth.md
阶段一:PPTX→MDreferences/stage1-parse.md
阶段二:MD→JSONreferences/stage2-generate.md
阶段三:合并 Excelreferences/stage3-merge.md

按需查阅(出错 / 疑问时才读,正常路径不触发)

场景查阅文档
目录与产出路径references/output-layout.md
12 分类 / JSON 字段名references/glossary.md
跨阶段易错点references/pitfalls.md
报错样例与处理references/failure-examples.md
文件处理服务 APItbs-skills/文件处理服务API说明.md

全局约束(横切)

  • 鉴权:细则见 references/auth.mdappKey 获取/注入/禁止项;禁止access-token 调文件处理服务)。
  • 分类 / 过滤 / 拆分 / 两步法 prompt:以 references/stage2-generate.md 为准。
  • 去重与 Excel 列:以 references/stage3-merge.mdscripts/merge_excel.py 为准。
  • 产出路径:以 references/output-layout.md 为准。
  • 阶段一 MD:落盘前剔除 API 输出的演讲者 ### Notes: 讲稿;幻灯片上的「备注:」等正文保留(见 references/stage1-parse.md)。

门禁(必须遵守)

  • 未取得有效 appKey(经 cms-auth-skills)→ 禁止调用 convert_pptx.py(见 references/auth.md)。
  • 阶段一:存在解析失败文件时,可继续阶段二,但须汇总失败列表;是否阻断由业务要求决定,默认继续处理已成功 .md(见 references/stage1-parse.md)。
  • 阶段二:某文档 JSON 未成功生成 → 阶段三合并该文件;子代理两步法未在同一任务内完成 → 视为本阶段失败(见 references/stage2-generate.md)。
  • 阶段三merge_excel.py 无任何有效 知识条目禁止视为建库完成;退出码 2 时不得进入交付(见 references/stage3-merge.md)。

标准执行流程(必须遵循)

  1. 鉴权:读取 references/auth.md,经 cms-auth-skills 取得 appKey;未就绪禁止阶段一。
  2. 阶段一:读取 references/stage1-parse.md,完成 PPTX→MD。
  3. 阶段二:读取 references/stage2-generate.md,完成 MD→JSON。
  4. 阶段三:读取 references/stage3-merge.md,执行 merge_excel.py 生成 Excel。
  5. 收尾:汇总各阶段失败/跳过列表;阶段三退出码 1 时须向用户说明部分文件未纳入合并。

排障说明(按需)

正常路径以各阶段文档中的脚本与门禁为准。references/pitfalls.mdreferences/failure-examples.md 仅在异常时查阅,不在正常路径中强制读取。