Security warning — review recommended

ClawHub Security found sensitive or high-impact capabilities. Review the scan results before using.

Thought-Retriever

提炼对话回答中的核心洞察为高置信度知识晶体,存储于本体驱动记忆系统的自我进化与复用。

Audits

Warn

Install

openclaw skills install thought-retriever

Thought-Retriever Skill

将每次对话中生成的回答,提炼成可积累、可复用的"知识晶体",驱动AI记忆系统的自我进化。

核心原理

Thought-Retriever 脱胎于论文 arXiv:2604.12231,其核心洞察是:

不要只检索原始数据,要检索 LLM 生成的想法(Thoughts)。

每次对话后,LLM的回答中蕴含着有价值的洞察——这些洞察才是记忆系统的核心养料,而不是原始对话日志。

五步循环

用户问题
    ↓
步骤1: 检索相关 Thought
    ↓(从 ontology 中找最相关的已有 Thought)
步骤2: 生成回答
    ↓(由主模型完成,这里只记录结果)
步骤3: 提炼候选思想 + 计算置信度
    ↓(用 LLM 从回答中抽取知识晶体,赋置信度)
步骤4: 查重剔除冗余
    ↓(相似度 > θ → 合并;置信度 < γ → 丢弃)
步骤5: 更新记忆
    ↓(新增/合并 Thought 到 ontology)

阈值参数

参数默认值说明
γ(gamma)0.6置信度阈值,低于此值的新 Thought 直接丢弃
θ(theta)0.80相似度阈值,高于此值视为重复,合并已有

存储结构

每个 Thought 是 ontology 中的一个实体:

{
  "id": "thou_59a993f9",
  "type": "Thought",
  "properties": {
    "content": "AI接单系统可以通过结合微信群与竞标平台形成多渠道互补",
    "confidence": 0.8,
    "last_accessed": "2026-05-02T07:42:59+00:00",
    "source": "conversation",
    "query": "赵匡的AI接单系统包括哪些渠道"
  }
}

置信度评分标准

分数含义
0.9-1.0明确验证过的结论,多个证据支持
0.7-0.8合理推断,有一定依据
0.5-0.6初步观察,可能需要验证
<0.5丢弃

文件位置

~/.openclaw/workspace/skills/thought-retriever/
  thought_retriever.py   ← 核心引擎
  SKILL.md              ← 本文件

~/.openclaw/workspace/memory/ontology/
  graph.jsonl           ← Thought 实体存储
  schema.yaml           ← Thought 类型定义

使用方式

命令行调用

python skills/thought-retriever/thought_retriever.py \
  --query "用户问题" \
  --answer "生成的回答" \
  --feedback "用户反馈(可选)"

配置为对话后钩子(OpenClaw)

在 OpenClaw 配置中注册为 post-turn 钩子,每次对话结束自动触发。

手动运行测试

python skills/thought-retriever/thought_retriever.py \
  --query "赵匡的AI接单系统包括哪些渠道" \
  --answer "包括微信群接单和dealwork.ai平台竞标两个渠道"

与其他组件的关系

组件作用
ontology提供存储和检索 Thought 的基础设施
self-improving记录失败案例,影响新 Thought 的初始置信度
Evolver读取 Thoughts,作为自我进化的分析素材

注意事项

  • 使用百炼 glm-5.1 模型(不走代理)
  • 每个 Thought 都有 query 字段,记录生成它时的原始问题
  • 置信度会在后续相关查询被触发时自动提升
  • 定期检查 memory/ontology/graph.jsonl 中的 Thought 数量和置信度分布