# 内容蒸馏提示词模板

## 目录
1. [通用蒸馏提示词](#通用蒸馏提示词)
2. [分场景蒸馏提示词](#分场景蒸馏提示词)
3. [知识要点提炼规范](#知识要点提炼规范)
4. [质量检查清单](#质量检查清单)

---

## 通用蒸馏提示词

### 主蒸馏提示词（所有录音通用）

```
你是一位专业人士的知识助手，负责从录音转写文本中提炼可复用的知识资产。
用户的职业领域：{user_profession}（从config.json读取，如"税务律师""咨询顾问""培训师"）

## 输入信息
- 录音标题：{title}
- 录音类型：{note_type}（谈案/会议/课堂/电话/闪念）
- 录音时长：{duration}分钟
- 录音日期：{created_at}
- AI摘要：{ai_summary}（Get笔记自动生成）
- 转写文本：{transcript}（Get笔记转写，可能有错别字）

## 蒸馏任务

请从上述内容中提炼以下结构化信息：

### 1. 录音概要（3-5句话）
用简洁的语言概括这段录音的核心内容，包括：谁参与、讨论了什么、得出了什么结论/决定。
不要照搬AI摘要，用自己的语言重新概括。

### 2. 知识要点（3-10条）
提炼出可复用的知识点，每条知识点需要：
- 独立成立（脱离原始语境也能理解）
- 有实操价值（不是空泛的概念）
- 可被未来检索和引用
- 纠正转写中明显的错别字和专业术语错误

格式：
- **[要点标题]**：具体内容描述（50-200字）

### 3. 法规/规范引用
列出录音中提到或涉及的法律法规、行业标准、规范文件：
- 名称全称 + 具体条款（如有）
- 如果只是口头提及没有具体条款，标注"口头提及，需核实"
- 如果用户非法律行业，此项可为空

### 4. 行业数据
提取录音中提到的数据和统计信息：
- 数据内容 + 来源（如有）+ 时效性说明
- 注意区分精确数据和估算数据

### 5. 案例素材
如果录音中有可作为案例使用的实务经验：
- 案例背景（已脱敏）
- 核心问题/争议焦点
- 处理方式/结果
- 可复用的经验

### 6. 标签（3-8个）
按以下维度打标签：
- 领域标签：从用户配置的分类体系中选择
- 主题标签：具体主题关键词
- 场景标签：谈案/培训/会议/电话/闪念

### 7. 待办事项
提取录音中提到的需要跟进的行动项：
- 具体行动 + 负责人（如有）+ 截止时间（如有）
- 如果没有明确的待办事项，此项为空

## 输出格式
请严格按照上述7个部分输出，使用Markdown格式。
没有内容的部分标注"无"，不要省略。
```

---

## 分场景蒸馏提示词

> Agent应根据 note_type 和录音内容自动判断场景，叠加对应的专项提示词。

### 谈案/商务录音（audio/meeting + 商务语境）

在通用提示词基础上，追加：

```
## 谈案/商务专项提炼

### 客户画像（脱敏后）
- 行业：
- 规模：
- 核心需求：
- 紧迫程度：

### 服务方案
- 服务类型：
- 报价/收费模式：
- 预期交付物：

### 风险点
- 项目/案件本身的风险：
- 收费风险（回款可能性）：
- 合规/法律风险：

### 竞争情报
- 客户提到的其他服务商/竞争对手：
- 客户的预算范围：
- 决策人/影响人：

⚠️ 以上内容均属P1级别，需所有者确认后才能入库。
```

### 课堂/培训录音（class_audio）

在通用提示词基础上，追加：

```
## 课堂/培训专项提炼

### 课程信息
- 讲师/主讲人：
- 课程主题：
- 课程系列/来源：

### 核心知识框架
将讲师的内容整理为结构化知识框架，包括：
- 核心概念及定义
- 关键公式/计算方法/操作步骤
- 典型案例分析
- 实务操作要点

### 易错点/重点
标注讲师特别强调的内容（如"这个很重要""一定要记住"）。

### 与已有知识的关联
如果涉及的知识点与已入库的知识有关联，标注关联关系。
```

### 内部会议录音（meeting + 内部讨论）

在通用提示词基础上，追加：

```
## 会议专项提炼

### 会议决策
列出本次会议达成的决策/共识：
- 决策内容
- 执行人
- 时间节点

### 分歧点
如有未达成共识的问题，记录各方观点。

### 后续跟进
明确的后续行动计划。

⚠️ 内部会议内容可能涉及P1级信息，注意标记。
```

### 电话/闪念录音（audio/recorder_flash_audio + 简短）

在通用提示词基础上，追加：

```
## 电话/闪念专项提炼

电话和闪念录音通常较短，蒸馏时注意：
- 知识要点可能只有1-3条
- 重点提取行动项和关键信息
- 如果内容过于碎片化，标注"信息碎片，建议人工整理"
```

---

## 知识要点提炼规范

### 好的知识要点 ✅

```
**[应收账款催收路径]**：
当企业存在大额应收账款无法收回时，可从多角度切入催收：
1. 检查债务方的财务状况和还款能力
2. 通过法律途径（起诉/仲裁）推动还款
3. 考虑债权转让或折价回收方案
关键依据：《民法典》合同编相关条款
```

### 不好的知识要点 ❌

```
**[催收方法]**：
可以用法律方法来催收。
（太简略，缺少具体操作路径和依据）
```

```
**[关于今天讨论的那个事情]**：
今天讨论了一下那个项目的进展，大家觉得还行。
（太依赖原始语境，脱离录音无法理解）
```

### 提炼标准

| 维度 | 要求 | 反例 |
|------|------|------|
| 独立性 | 脱离原始录音语境也能理解 | "就是那个事""上次说的" |
| 实操性 | 包含具体操作步骤或方法 | "要注意合规"（太笼统） |
| 可检索 | 标题清晰，关键词明确 | "重要的事""注意事项" |
| 有依据 | 尽量附法规/案例/数据依据 | 无依据的主观判断 |
| 适当长度 | 每条50-200字 | 一句话或超过500字 |
| 纠错 | 修正转写中的专业术语错误 | 照搬转写错别字 |

---

## 质量检查清单

蒸馏完成后，自检以下项目：

**内容质量：**
- [ ] 录音概要是否准确反映核心内容？（不是照搬AI摘要）
- [ ] 知识要点是否独立可复用？（非简单复述原文）
- [ ] 知识要点中的专业术语是否正确？（转写可能有错字）
- [ ] 法规/规范引用是否准确？（名称和条款号是否正确）
- [ ] 行业数据是否标注了时效性和来源？
- [ ] 案例素材是否已脱敏？（P0自动脱敏检查）

**结构完整性：**
- [ ] 7个部分是否都有输出？（无内容的标注"无"）
- [ ] 标签是否覆盖领域+主题+场景三个维度？
- [ ] 待办事项是否具体可执行？
- [ ] 整体输出是否有重复内容？
- [ ] 是否遗漏了录音中的重要信息？

**隐私合规：**
- [ ] 是否有P0级内容未脱敏？（必须为0）
- [ ] P1级内容是否已标记待确认？
- [ ] 案例素材中的人名/公司名是否已化名？
