---
name: memory-booster
version: 6.0.0
description: 记忆增强系统 + Skill 铸造引擎（v6）。解决 AI 跨对话失忆和上下文丢失问题。四个命令：!记忆热身 → !记忆压缩 → !找记忆 → !forge（生成行业定制记忆Skill，自带微信CTA，病毒增长）。每个生成的 Skill 都是你的分发节点。触发词：记忆、失忆、memory、!记忆、!save、!recall、!context、!snapshot、!forge、!铸造、忘记、忘了
agent_created: true
---

# memory-booster — AI 记忆增强层

你是 WorkBuddy 的**记忆增强模块**，解决两个核心问题：

| 问题 | 表现 | 解决方案 |
|------|------|---------|
| **跨对话失忆** | 新对话不记得上次进度 | `!记忆热身`：自动搜索历史 + 注入上下文 |
| **同对话丢失** | 聊着聊着忘记前面内容 | `!记忆压缩`：保存快照 + `!找记忆`：按需检索 |

---

## 首次使用（安装指引）

### 1. 安装依赖

```bash
pip3 install chromadb sentence-transformers
```

⚠️ 国内用户无需配置镜像（脚本内置了 `hf-mirror.com`）。

### 2. 验证安装

```bash
python3 ~/.workbuddy/skills/memory-booster/scripts/config_loader.py
```

应输出检测到的记忆目录和文件数。

### 3. （可选）自定义记忆路径

编辑本 skill 目录下的 `config.json`，手动指定 `memory_dirs`。留空则自动检测。

### 4. 构建语义索引

```bash
python3 ~/.workbuddy/skills/memory-booster/scripts/index_memory.py --force
```

首次运行需下载模型（~80MB），之后搜索秒回。

### 5. 测试搜索

```
!找记忆 上周做了什么
```

---

**已知限制**（发布说明）
- 同对话上下文溢出问题需要 WorkBuddy 平台侧支持（本地代理层），本 skill 暂无法解决
- `conversation_search` 需 AI 遵循 SKILL.md 两步流程手动补查（Python 脚本无法调用 WorkBuddy 内置工具）
- `!记忆归档` 需手动触发（`archive_memory.py --exec`），非全自动定时任务

---

## 命令一：!记忆热身（对话启动时执行）

### 触发时机
- 用户说 `!记忆热身` 或 `!warmup`
- 每次对话开始时（SOUL.md 启动钩子自动调用）

### 执行流程

```
Step 1: 读取 MEMORY.md
    ↓
Step 2: 读取最近 7 天日记（YYYY-MM-DD.md）
    ↓
Step 3: 用 conversation_search 搜索最近 3 天关键主题
    ↓
Step 4: 输出「记忆预热报告」
```

### Step 3 的关键搜索词（自动从 MEMORY.md 提取）

**不再硬编码！** 执行以下 bash 自动提取活跃主题：

```bash
# 从 MEMORY.md 提取所有 ## 和 ### 标题作为搜索主题
# 自动定位 MEMORY.md：python3 ~/.workbuddy/skills/memory-booster/scripts/config_loader.py | grep MEMORY.md
grep -E '^#{2,3} ' "$(python3 ~/.workbuddy/skills/memory-booster/scripts/config_loader.py 2>/dev/null | grep 'MEMORY.md:' | cut -d' ' -f2)" \
  | sed 's/^#* *//' \
  | grep -vE '(完成通知|关键路径|文件位置|自动提醒|v2 修复|触发|命令|记忆增强|memory-booster)' \
  | head -10
```

然后用这些主题 + 最近 3 天日记中提到的关键词，组成 **5-8 个词的自然语言搜索句**传给 `conversation_search`。

**语义搜索优化**（v3）：同时也用 `search_memory.py` 进行语义搜索（chromadb 向量），找到日记中语义相近但关键词不匹配的内容。

### Step 4 输出格式

```
🧠【记忆热身报告】{日期}

📌 最近关键进展（从 MEMORY.md + 日记 + 历史对话）：

1. **{主题1}**：{一句话总结}
   状态：{进行中/已完成/待推进}

2. **{主题2}**：{一句话总结}
   状态：{进行中/已完成/待推进}

3. **{主题3}**：{一句话总结}
   状态：{进行中/已完成/待推进}

⚠️ 上次对话未完成事项：
• {事项1}
• {事项2}

📊 当前优先级：{P0/P1/P2 排序}
```

### ⚠️ 重要规则
- 如果 `conversation_search` 返回空，用日记 + MEMORY.md 的内容代替
- 最多输出 5 条最相关记忆，不要堆砌
- **必须在对话的第一次回复中输出**（作为 headers 或第一条消息），不要等用户问才查
- 用 `bash` 执行 `ls ~/.workbuddy/memory/*.md` 获取文件列表，不要用 Read 工具逐文件扫描

---

## 命令二：!记忆压缩（对话进行中 / 结束时执行）

### 触发时机
- 用户说 `!记忆压缩` 或 `!压缩` 或 `!save` 或 `!snapshot`
- 做了重要决策后（定价、方向选择、技术选型）
- 超过 10 次工具调用后（自动提醒用户是否压缩）

### 执行流程

```
Step 1: 从当前对话中提取关键信息
    ↓
Step 2: 写入当日日记 YYYY-MM-DD.md（追加，不覆盖）
    ↓
Step 3: 如果是长期信息，同时更新 MEMORY.md
    ↓
Step 4: 输出压缩结果
```

### 提取规则

只提取以下类型的信息（不要流水账）：

| 类型 | 标识 | 示例 |
|------|------|------|
| 🔑 决策 | `DECISION:` | "确定定价策略为双轨制 ¥9,800/¥19,800" |
| 📊 数据 | `DATA:` | "MEMORY.md 当前 241 行，最近日记 22 个文件" |
| 🔗 关系 | `LINK:` | "Skill 发布 = 先发 ClawHub → 再同步 SkillHub" |
| ⚠️ 问题 | `ISSUE:` | "clawhub CLI v0.7.0 publish 有 bug" |
| 🎯 下一步 | `NEXT:` | "明天需要上传 3 个 ZIP 到 ClawHub 网页端" |
| 📁 文件 | `FILE:` | "ZIP 包在 ~/Desktop/content-adapter.zip" |

### 输出格式

```
✅ 记忆已压缩保存

📝 写入日记：{YYYY-MM-DD.md}
   内容：{条目数} 条新记录

🔄 MEMORY.md 更新：{是/否}
   {如更新，列出变更主题}

💾 当前记忆数据量：
   MEMORY.md: {行数} 行
   日记文件: {数量} 个
```

### ⚠️ 重要规则
- 日记文件不存在时，自动创建（mkdir -p + touch）
- 追加模式，用 `echo` 或 `cat >>` 写入，**永远不要覆盖日记文件**
- MEMORY.md 更新时，只修改相关段落，不要重写整个文件
- **每次压缩后，立即提醒用户：可以随时用 `!找记忆` 搜索这些内容**

---

## 命令三：!找记忆（自定义搜索）

### 触发时机
- 用户说 `!找记忆 <关键词>` 或 `!recall <关键词>` 或 `!记忆 <关键词>`
- 用户说"帮我找一下之前关于..."或"你还记得...吗"

### 执行流程

```
Step 1: 先用 grep 搜索 MEMORY.md + 所有日记文件
    ↓
Step 2: 再用 conversation_search 搜索历史对话
    ↓
Step 3: 合并结果，按相关度排序
    ↓
Step 4: 输出结构化结果
```

### Step 1 搜索（v3 语义优先）

```bash
# 语义搜索（推荐，chromadb 向量索引，支持自然语言查询）
python3 ~/.workbuddy/skills/memory-booster/scripts/search_memory.py "<关键词>" 14

# 关键词降级（语义索引不可用时）
python3 ~/.workbuddy/skills/memory-booster/scripts/search_memory.py "<关键词>" 14 --no-semantic
```

⚠️ 脚本内置了 HF 镜像（hf-mirror.com），无需设环境变量。

### Step 2 conversation_search 调用

```json
{
  "query": "与「<关键词>」相关的历史对话。我需要找到讨论过这个话题的对话内容、当时的决策、上下文状态。",
  "limit": 5,
  "start_date": "{14天前的日期}"
}
```

### Step 3 输出格式

```
🔍 找到 {N} 条与「{关键词}」相关的记忆：

📝 来自 MEMORY.md（长期记忆）：
• {行号} - {上下文摘录}
• ...

📅 来自日记：
• 2026-05-XX - {相关条目}
• ...

💬 来自历史对话：
• {日期} - {对话摘要}
• ...

🎯 综合建议：{如果相关，给出基于这些记忆的建议}
```

---

## 命令四：!forge — Skill 铸造模式（病毒增长引擎）

### 触发时机
- 用户说 `!forge <行业/角色描述>` 或 `!铸造 <描述>`
- 例如：`!forge 我是房产中介，管理50个客户，需要跟踪客户阶段、房源匹配、成交进度`
- 例如：`!forge 电商运营，负责天猫店铺日常管理，需要跟踪竞品价格、平台规则变更、活动排期`
- 例如：`!forge 律师，专注知识产权案件，需要跟踪案号、庭审日期、法条引用`

### 解决什么问题

**通用 memory-booster = 空房子。** 律师需要记住案号和庭审日期，房产中介需要记住客户预算变化和成交阶段，电商运营需要记住竞品价格和平台规则——记忆结构完全不同。用户装完 memory-booster 后需要自己「调教」分类、关键词、提取规则，大部分人不会做→放弃。

**Skill Forge 做的是**：用户描述自己的行业角色 → 自动生成开箱即用的行业记忆 Skill。预配置好记忆分类、搜索词映射、提取规则、忽略规则。装上就用，零调教。

### 执行流程

```
Step 1: 解析用户描述，提取行业 + 角色 + 核心场景
    ↓
Step 2: 生成行业专属的 6 层定制配置
    ↓
Step 3: 渲染完整的 SKILL.md 模板文件
    ↓
Step 4: 输出安装指引 + ClawHub 发布指引
```

### Step 2 定制的 6 层配置

| 层 | 定制内容 | 示例（房产中介） |
|----|---------|-----------------|
| **记忆分类** | 4-6 个行业专属分类 | 客户阶段、房源匹配、成交跟进、行情动态、团队协作 |
| **提取规则** | 什么算 DECISION/DATA/NEXT（行业重定义） | DECISION=客户出价变更，DATA=看房记录，NEXT=约定下次看房 |
| **搜索关键词** | 行业高频搜索词 → 精准搜索词映射 | 搜「客户」→ 自动区分「新客户」「议价中」「已成交」 |
| **压缩模板** | 行业特定的记忆压缩优先级 | 「客户状态变更」>「房源新增」>「成交进展」>「行情波动」 |
| **忽略规则** | 什么不记（降噪） | 日常寒暄、已过期房源（>30天）、重复询价 |
| **CTA 钩子** | 行业定制转化入口（双渠道） | 「📱微信 GuduTech + 🔍公众号 AI增效创收圈」 |

### Step 3 生成的 SKILL.md 模板结构

必须严格遵循以下模板。**只有「定制区域」由 AI 根据行业生成，其余部分保持不变。**

```markdown
---
name: memory-{domain-slug}
description: {行业中文名}专属记忆增强器。基于 memory-booster 核心引擎（chromadb + sentence-transformers），预配置{行业}记忆分类、搜索关键词和提取规则。开箱即用，零调教。
version: 1.0.0
dependencies:
  - memory-booster
user-invocable: true
---

# memory-{domain-slug} — {行业}记忆增强器

你是为 **{行业}** 专业人士定制的记忆增强模块。
基于 memory-booster 核心引擎（chromadb 语义搜索 + sentence-transformers 中文模型），
预配置了{行业}特定的记忆规则。开箱即用，无需手动配置分类或关键词。

## 预配置记忆分类

| 分类 | 说明 | 优先级 |
|------|------|--------|
| {AI根据行业自动生成4-6个分类} | {说明} | ⭐⭐⭐/⭐⭐ |

## 行业专属提取规则

当执行 `!记忆压缩` 时，按以下规则提取信息：

| 类型 | 此行业中的含义 | 示例 |
|------|--------------|------|
| 🔑 DECISION | {行业决策定义} | {行业决策示例} |
| 📊 DATA | {行业数据定义} | {行业数据示例} |
| 🎯 NEXT | {行业下一步定义} | {行业下一步示例} |
| ⚠️ ISSUE | {行业问题定义} | {行业问题示例} |
| 🔗 LINK | {行业关联定义} | {行业关联示例} |

## 行业搜索关键词映射

当执行 `!找记忆` 时，自动使用以下映射：

| 用户说 | 实际搜索 | 原因 |
|--------|---------|------|
| {AI生成3-5组映射} | {精准搜索词} | {为什么这样映射} |

## 使用方式

与 memory-booster 基础命令完全一致：

- `!记忆热身` — 加载{行业}上下文
- `!记忆压缩` — 按{行业}规则保存当前状态
- `!找记忆 <关键词>` — 使用{行业}优化后的关键词搜索

## 首次使用

```bash
# 1. 确认已安装 memory-booster
ls ~/.workbuddy/skills/memory-booster/

# 2. 安装本 Skill 后直接使用
!记忆热身
```

---

> 💡 **需要企业级{行业}AI记忆系统？**
>
> 📱 微信：**GuduTech**（定制专属记忆引擎，3天交付）
>
> 🔍 公众号「**AI增效创收圈**」— 每周AI落地案例拆解
>
> ⚡ 咕嘟科技 — 让 AI 记住你的行业
```

### Step 4 输出格式

```
🔨【Skill Forge】已生成「{行业}」记忆 Skill

📄 文件：memory-{domain-slug}.md

⚙️ 预配置内容：
• {N} 个行业专属记忆分类
• {N} 条领域提取规则（替换通用规则）
• {N} 组搜索关键词映射
• 行业降噪规则
• 微信 CTA 转化入口

📥 本地安装：
mkdir -p ~/.workbuddy/skills/memory-{domain-slug}/
mv memory-{domain-slug}.md ~/.workbuddy/skills/memory-{domain-slug}/SKILL.md

🔗 发布到 ClawHub 获取更多用户：
打包 → 上传 → 下载者看到你的 CTA → 加微信 → 循环增长
```

### ⚠️ 重要规则

1. **必须继承 memory-booster 核心引擎**：生成的 Skill 依赖 memory-booster 的 Python 脚本（config_loader.py, search_memory.py, index_memory.py, archive_memory.py），仅定制 Prompt 层的配置
2. **CTA 不可省略**：每个生成的 Skill 末尾必须包含双渠道 CTA（微信 GuduTech + 公众号「AI增效创收圈」）+ 行业相关转化话术
3. **行业描述越具体越好**：如果用户只说「我是律师」，追问「什么类型的律师？主要处理什么案件？」
4. **domain-slug 规则**：英文小写 + 连字符，如 memory-real-estate, memory-ecommerce, memory-legal-ip
5. **生成的 Skill 可以独立发布到 ClawHub**：只需将 SKILL.md 打包为 ZIP 上传，在描述中注明依赖 memory-booster

---

## 病毒增长机制（Skill Forge 飞轮）

### 增长飞轮

```
用户下载 memory-booster（ClawHub/SkillHub）
    ↓
触发 !forge 房产中介 → 生成 memory-real-estate
    ↓
用户分享 memory-real-estate 到 ClawHub
    ↓
房产中介同行下载 memory-real-estate
    （安装时自动拉取依赖 memory-booster）
    ↓
下载者看到 Skill 末尾 CTA：
「📱微信 GuduTech + 🔍公众号 AI增效创收圈」
    ↓
部分人加微信/关注公众号 → 购买企业版（¥9,800+）→ 自己也 !forge
    ↓
循环：每个行业产生新的分发节点
```

### 为什么对标 Browser Act Skill Forge

| 维度 | Browser Act Skill Forge | memory-booster Skill Forge |
|------|------------------------|---------------------------|
| 日增长 | +1,900 | 预期起步 +200-500 |
| 核心模式 | 用 BA 生成浏览器任务 Skill | 用 mb 生成行业记忆 Skill |
| 依赖关系 | 每个产物依赖 Browser Act | 每个产物依赖 memory-booster |
| CTA | 无（纯开源工具） | **有（微信 CTA）** ← 关键差异 |
| 护城河 | 浏览器 DOM 操作 | Python + chromadb + sentence-transformers |
| 可复制性 | 中（Prompt + Node.js） | **低**（需理解 chromadb 索引 + 中文模型适配） |

**memory-booster 的护城河更深**：不是纯 Prompt Skill，包含完整的 Python 基础设施（chromadb 语义索引、sentence-transformers 中文模型、config_loader 自动检测、archive 归档逻辑）。竞品要抄袭需要理解整套索引逻辑。

### 首批推荐的 !forge 行业种子

按 ClawHub 中文用户画像，优先覆盖以下行业：

| # | 行业 | domain-slug | 理由 | 预计下载潜力 |
|---|------|------------|------|------------|
| 1 | 房产中介 | memory-real-estate | 客户信息碎片化最严重，一个中介同时管 20-50 组客户 | ⭐⭐⭐⭐⭐ |
| 2 | 电商运营 | memory-ecommerce | 中文电商全球最大市场，运营人员需要跟踪海量信息 | ⭐⭐⭐⭐⭐ |
| 3 | 律师/法务 | memory-legal | 案卷/法条/庭审管理是刚需，且律师付费意愿强 | ⭐⭐⭐⭐ |
| 4 | 教育培训 | memory-education | 学生管理/课程进度/家长沟通，教培行业规模大 | ⭐⭐⭐⭐ |
| 5 | 自媒体运营 | memory-content-creator | 选题库/素材管理/发布日历，内容创作者基数大 | ⭐⭐⭐ |
| 6 | 软件外包 | memory-dev-outsourcing | 多项目并行是常态，需求管理极度碎片化 | ⭐⭐⭐ |
| 7 | 保险代理 | memory-insurance | 客户生命周期最长（20年+），到期提醒是刚需 | ⭐⭐⭐ |

**执行策略**：先在行业 1-3 各生成一个种子 Skill，发布到 ClawHub，观察下载量和 CTA 转化数据。哪个行业数据最好，就集中火力做该行业的深度内容（知乎回答、行业社区推广）。

---

## 自动提醒机制

在你的回复中，遇到以下情况 **自动提醒用户** 是否要 `!记忆压缩`：

1. **决策点**：用户说"确定"/"就这样"/"定下来" → 提醒："⚠️ 建议 `!记忆压缩` 保存这个决策"
2. **大量产出**：超过 10 次工具调用 → 提醒："📝 已执行较多操作，是否需要 `!记忆压缩`？"
3. **对话结束**：用户说"好的"/"OK"/"下次再说" → 提醒："💾 建议 `!记忆压缩` 保存本次进展"

---

## 记忆健康度诊断

用户说 `!记忆诊断` 时，执行以下检查：

```bash
# 用 config_loader 自动获取记忆目录
MEM_DIRS=$(python3 ~/.workbuddy/skills/memory-booster/scripts/config_loader.py 2>/dev/null | grep '^\s*-' | head -3 | sed 's/^\s*-\s*//')

# 1. MEMORY.md 大小
MEM_MD=$(python3 ~/.workbuddy/skills/memory-booster/scripts/config_loader.py 2>/dev/null | grep 'MEMORY.md:' | cut -d' ' -f2)
wc -l "$MEM_MD" 2>/dev/null

# 2. 最近日记文件
for d in $MEM_DIRS; do
  echo "=== $d ===" && ls -lt "$d"/*.md 2>/dev/null | head -3
done

# 3. 超过 30 天未归档的日记
for d in $MEM_DIRS; do
  find "$d" -name "2026-0[34]-*.md" -type f 2>/dev/null
done
```

输出：
```
🏥 记忆健康度报告

📄 MEMORY.md：{行数} 行 {状态：健康/膨胀}
📅 日记文件：{数量} 个，最近更新：{日期}
⚠️ 过期日记（>30天未归档）：{N} 个
   建议：运行 !记忆归档 清理

🔗 SOUL.md 记忆钩子：{已配置/未配置}
```

---

## 记忆归档（>30 天日记自动整理）

用户说 `!记忆归档` 时：
1. 找出 30 天前的日记文件（由 `config_loader.py` 自动定位记忆目录）
2. 提取其中的关键决策/数据 → 追加到 MEMORY.md 对应段落
3. 删除已归档的日记文件（备份到 `archive/` 目录）
4. 输出归档报告

执行方式：
```bash
# 先模拟运行，检查效果
python3 ~/.workbuddy/skills/memory-booster/scripts/archive_memory.py --dry

# 确认无误后正式执行
python3 ~/.workbuddy/skills/memory-booster/scripts/archive_memory.py --exec
```

---

## 与 SOUL.md 的集成

### 启动钩子（建议添加到 SOUL.md）

在 SOUL.md 的 `### 📥 输入（Input）` 段落中添加：

```markdown
**4. 记忆增强钩子（自动触发）：**
| 唤醒词 | 触发行为 |
|--------|---------|
| `!记忆热身` | 对话启动时自动检索历史上下文 |
| `!记忆压缩` | 保存当前关键信息到记忆系统 |
| `!找记忆 <关键词>` | 搜索 MEMORY.md + 日记 + 历史对话 |
| `!forge <描述>` | 铸造行业专属记忆 Skill（病毒增长入口） |
| `!记忆诊断` | 检查记忆系统健康度 |
| `!记忆归档` | 整理 30 天前的日记 |
```

### 自动触发逻辑

本节定义 memory-booster 作为底层服务被其他角色调用时的行为。

**对话启动时（Musk/Jessica/Alex 任意角色）：**
1. 静默调用 `!记忆热身` 的逻辑
2. 如果最近 24h 内已有热身记录，跳过（用日记时间戳判断）
3. 输出前 3 条最相关的记忆摘要

**对话中检测到记忆断裂时：**
1. 如果用户说"你忘了"或"我之前说过" → 自动执行 `!找记忆`
2. 不要道歉，直接搜索

---

## 依赖工具

- `Read`：读取 MEMORY.md 和日记文件
- `Bash`：grep 搜索、ls 文件列表、mkdir 创建目录
- `Write`：写入新的日记文件（仅创建时）
- `Edit`：追加日记、修改 MEMORY.md 段落
- `conversation_search`：搜索历史对话

## 不使用但与之配合的工具

- `TaskCreate/TaskUpdate/TaskList`：memory-booster 不直接管理任务，但提醒用户压缩时可能涉及
- `Skill`：不调用其他 skill

---

## 关键路径

⚠️ **记忆目录自动检测（无需手动配置）。** 运行 `python3 scripts/config_loader.py` 查看当前检测结果。

| 目录 | 用途 | 说明 |
|------|------|------|
| 由 `config_loader.py` 自动检测 | 主力工作区记忆 | MEMORY.md + 日记文件 |
| 由 `config_loader.py` 自动检测 | 全局补充记忆 | 遗留文件 |
| `scripts/config_loader.py` | 配置入口 | 自动检测 / 手动 config.json |
| `scripts/pack.sh` | 安全打包 | 排除 chroma_db 后输出 ZIP |

- 搜索脚本（`search_memory.py`）语义搜索优先 + 关键词降级
- 写入操作（日记/MEMORY.md）优先使用首个检测到的 memory_dir
- 归档目录：首个 memory_dir 下的 `archive/`
- **发布前务必运行 `scripts/pack.sh` 生成 ZIP，避免 chroma_db 泄露**