semantic-split

Other

语义拆分与智能规划技能。将自然语言拆分为结构化需求块,基于规则级/能力级json渐进加载生成串并行规划步骤,支持自增强json沉淀机制。

Install

openclaw skills install semantic-split

语义拆分与智能规划技能 (Semantic Split v2.2)

核心能力

#功能说明
1语义拆分识别主语 → 划分块 → 提取目的/行为/动机
2结构化输出统一格式输出拆分结果,含确认询问
3渐进式加载规则级/能力级 json 渐进匹配,未命中时模型思考
4自增强闭环一次使用 → 沉淀 json → 下次复用
5json 管理工具json_manager.py CLI 统一管理能力级/规则级 json

快速开始

# 扫描知识库匹配任务
python scripts/json_manager.py scan --keywords 制作 PPT 产品

# 归类统计(判断是否达到规则级凝练阈值)
python scripts/json_manager.py categorize --threshold 5

# 创建能力级 JSON 骨架
python scripts/json_manager.py create --type capability --name my_task_v1

# 通用化(字段替换为占位符)
python scripts/json_manager.py generalize --input <json_path> --params "具体值=[占位符]"

知识库 JSON 文件存放于 ~/.workbuddy/semantic-split/data/(铁律4:产出物不嵌入技能目录)


第一部分:语义拆分规则

一、划分块(Block)

识别主语,划分语义块:

主语类型识别方式块标记
用户("我")说话者本人块1:用户
AI助手("你")执行者、帮助者块2:执行者
第三方("他/她/它")提及的其他角色块3:第三方-N

块内元素提取:

元素定义示例
目的 (Purpose)最终要达成的目标"明天要介绍产品"
行为/诉求 (Request)需要执行的具体操作或交付物"做一个PPT"、"写一份报告"
动机 (Motivation)为什么会产生这个需求"PPT太难做了"、"时间紧迫"

二、诉求聚合(Request Aggregation)

将同一目的下的所有诉求点聚合,包括:

  • 核心诉求(主要交付物)
  • 支撑信息(背景、条件、约束)
  • 附加细节(特征、规格、要求)

三、常见主语映射表

文本中的词映射为备注
我、咱们、俺用户说话者本人
你、您执行者AI助手
我们用户(含其团队)视为用户群体
他/她/它 + [名称]第三方需标注具体身份
[公司/产品名]第三方实体对象

四、边界情况处理

情况处理方式
单用户无明确主语默认主语为"用户"
多个并列诉求同一块内编号列表
隐含目的根据上下文推断,动机标注"[推断]"
情绪/语气词归入动机,标注"[情绪]"
时间/预算约束归入目的或诉求约束条件
json 库为空跳过①②,直接进入③模型思考
json 部分匹配取最佳匹配,渐进加载补充

第二部分:完整执行流程

步骤 1:接收输入

用户输入 → 保留原文,记录原始输入

步骤 2:识别主语 & 划分块

扫描文本,识别所有主语代词和指代:

  • 第一人称:我、咱们、俺
  • 第二人称:你、您、咱们
  • 第三人称:他、她、它、以及具体名称

每个独立主语 = 一个块

步骤 3:提取块内元素

对每个块,逐句分析:

对于 [主语] 说的每句话:
  → 目的:这句话要达成什么?(找"为了"、"要"、"想"等关键词)
  → 行为:需要做什么具体操作?(找动词)
  → 动机:为什么会这么说?(找原因、背景、情绪)

步骤 4:结构化输出

【原始输入】
[用户原话完整引用]

【拆分结果】

## 块 N:[主语名称]
  角色:[用户/执行者/第三方]
  目的:[该主语要达成的核心目标]
  诉求:
    1. [诉求点1 - 核心交付物]
    2. [诉求点2 - 支撑信息/细节]
  动机:[产生该需求的背景/原因/情绪]

【确认询问】
以上拆分是否完整准确?如有遗漏或错误,请补充或纠正。

步骤 5:用户确认

  • 如有遗漏 → 用户补充 → 更新结构
  • 如全部正确 → 进入步骤 6

步骤 6:渐进加载与规划生成

⚠️ 本步骤需要加载参考文档。执行前读取以下文件:

  • references/loading_decision_tree.md — 渐进加载决策树(必须加载)
  • references/planning_rules.md — 规划规则详情(模型思考时加载)
  • references/json_schema.md — json 结构规范(生成 json 时加载)

按决策树执行:

  1. 扫描规则级 json 库 → 命中则加载并展示规划
  2. 不命中则扫描能力级 json 库 → 命中则加载并展示规划
  3. 均不命中则模型思考生成规划(需加载 references/planning_rules.md
  4. 展示规划 → 询问用户是否执行(含调整/新建 json 选项)

步骤 7:执行与 json 生成

  • 用户确认执行 → 执行任务
  • 仅分支③(不命中 + 确认执行)→ 执行完成后生成通用化能力级 json(需加载 references/json_schema.md
  • 其他分支 → 不生成新 json(除非用户主动要求更新/新建)

第三部分:触发条件

当用户出现以下意图时,必须触发本技能:

  1. 提出任务请求("帮我做..."、"请你...")
  2. 表达需求("我需要..."、"我想...")
  3. 委托工作("交给你了..."、"你去...")
  4. 描述问题寻求帮助("有个问题...帮我...")
  5. 用户未明确说但有明显需求意图时

注意:简单问答("今天天气怎么样")、闲聊("你好")无需拆分。


脚本工具

json_manager.py — 管理能力级/规则级 json 的 CLI 工具(零外部依赖)。

子命令功能
scan按关键词扫描匹配 json 库
categorize按 tags 归类统计
generalize字段替换通用化
rule-gen从能力级 json 生成规则级框架
list列出所有 json 文件
create创建新 json 骨架
validate验证 json 格式
info显示 json 详情

脚本路径:~/.workbuddy/skills/semantic-split/scripts/json_manager.py


参考文档(渐进加载)

文件加载时机
references/loading_decision_tree.md步骤 6 必须加载
references/planning_rules.md模型思考时加载
references/json_schema.md生成 json 时加载
references/automation_tasks.md定时任务时加载
references/examples.md参考拆分格式时加载

版本

当前版本:2.3.0 — v2.3.0:DATA_DIR 路径修正(Path.home()/standardization → SKILL_DIR.parent/.standardization/semantic-split/data/),_meta.json 补充 data_dir 字段