Get笔记炼金术

Other

Get笔记炼金术 — 将Get笔记中的录音笔记（谈案、会议、课堂、电话）经过隐私审查→内容蒸馏→结构化沉淀→多端归档，转化为可复用的知识数字资产。适用人群：律师、咨询师、培训师、销售等大量使用录音记录工作的专业人士。触发条件： (1) 用户说"处理录音""录音转知识库""录音沉淀""消化录音""录音炼金" (2) 用户说"Get笔记同步飞书""录音归档""录音整理" (3) 定时任务触发：自动扫描新录音并处理 (4) 用户指定某条录音笔记进行处理核心能力：隐私保护、内容蒸馏、知识分类、多端沉淀（飞书多维表格+IMA知识库+飞书知识库）依赖：Get笔记App + OpenClaw + 飞书（可选IMA知识库）环境变量：GETNOTE_API_KEY、GETNOTE_CLIENT_ID

Install

openclaw skills install getnote-alchemy

Get笔记炼金术 — 录音→知识数字资产

💡 一句话说明：你的Get笔记里躺着几十上百条录音，每条都是"数字垃圾"。这个技能把它们自动变成可搜索、可复用、有隐私保护的知识资产。

快速开始

30秒上手

确保已安装 Get笔记App 并开通录音转写
配置环境变量：GETNOTE_API_KEY 和 GETNOTE_CLIENT_ID（获取方式）
对 Agent 说："处理我的录音" — 首次运行会自动创建飞书多维表格

就这么简单。Agent会自动拉取你的录音 → 隐私审查 → 蒸馏知识 → 写入多维表格。

进阶配置（可选）

编辑 config.json 解锁更多能力：

🧠 IMA知识库同步（语义搜索，问答时自动召回）
📚 飞书知识库同步（团队共享文档）
🏷️ 自定义分类体系（适配你的行业）
🔒 隐私策略调整（脱敏规则、确认超时）
⚙️ 处理参数（批量大小、最短时长过滤）

总览

Get笔记录音 → 隐私审查 → 内容蒸馏 → 分类归档 → 多端沉淀
   (输入)      (Step 1)    (Step 2)    (Step 3)    (Step 4)

一条录音的完整旅程：

Get笔记App录音 → 自动转写+AI摘要
OpenClaw拉取录音笔记详情
🔴 隐私审查：扫描敏感信息，标记/脱敏/提醒所有者
内容蒸馏：从转写文本中提炼知识点、案例、法规、数据
分类归档：按领域自动分类
多端沉淀：飞书多维表格（结构化检索）+ 可选IMA知识库 + 可选飞书知识库

Step 1：拉取录音笔记

1.1 扫描新录音

从Get笔记API拉取录音类型笔记，筛选未处理的：

GET https://openapi.biji.com/open/api/v1/resource/note/list?cursor=0

录音类型过滤（note_type）：

audio — 即时录音（谈案、电话）
meeting — 会议录音
class_audio — 课堂录音（培训、讲座）
local_audio — 本地音频文件
recorder_audio — 录音卡长录
recorder_flash_audio — 录音卡闪念

1.2 获取笔记详情

GET https://openapi.biji.com/open/api/v1/resource/note/detail?id={note_id}

关键字段提取：

字段路径	内容	用途
`data.note.title`	标题	录音主题
`data.note.content`	AI摘要+正文	蒸馏输入
`data.note.audio.transcript`	完整转写文本	蒸馏输入（主要）
`data.note.audio.duration`	时长（秒）	元数据
`data.note.tags`	自动标签	分类参考
`data.note.created_at`	创建时间	归档时间
`data.note.note_type`	录音类型	场景分类

1.3 认证配置

Headers:
  Authorization: $GETNOTE_API_KEY
  X-Client-ID: $GETNOTE_CLIENT_ID

⚠️ 笔记ID是int64，JavaScript中必须当字符串处理，防止精度丢失。

Step 2：🔴 隐私审查（最关键环节）

铁律：任何录音内容在蒸馏和沉淀之前，必须先过隐私审查。

2.1 敏感信息三级分类

级别	类型	处理方式
🔴 P0-绝对禁止	身份证号、银行卡号、密码、当事人真名+案情	自动脱敏，不等确认
🟡 P1-需确认	客户名称、具体金额、商业策略、诉讼策略	提醒所有者确认后再入库
🟢 P2-可入库	法律条文、公开案例、行业通用数据、操作流程	直接入库

2.2 审查流程

转写文本
  ↓
自动扫描 → 识别P0/P1/P2内容
  ↓
P0内容 → 自动脱敏
P1内容 → 生成「隐私确认清单」→ 通知所有者确认
P2内容 → 直接进入蒸馏环节
  ↓
所有者确认P1（超时默认脱敏）
  ↓
生成「隐私审查报告」存档

详细的隐私审查规则、脱敏方法、审查报告模板见 references/privacy-rules.md

Step 3：内容蒸馏

目标：从原始转写文本中提炼出可复用的知识资产，不是存原文。

3.1 蒸馏产出物（7项）

产出物	说明
📋 录音概要	3-5句话概括核心内容
🎯 知识要点	可复用知识点（3-10条）
⚖️ 法规引用	涉及的法律法规条文
📊 行业数据	提到的数据/统计信息
📁 案例素材	可复用的实务经验
🏷️ 标签	自动分类标签
✅ 待办事项	录音中的行动项

3.2 蒸馏提示词

详见 references/distill-prompts.md，包含：

通用蒸馏提示词（所有录音）
谈案专项提炼（客户画像、服务方案、风险点）
课堂专项提炼（知识框架、易错点）
会议专项提炼（决策、分歧、跟进）

3.3 默认分类体系

一级分类	二级分类示例
法律	诉讼、合同、知产、劳动
财税	税务筹划、税务争议、财务分析
金融	投融资、并购、跨境
行业	客户管理、AI应用、培训学习

可在 config.json 中自定义分类体系。

Step 4：多端沉淀

4.1 飞书多维表格（必选，结构化检索）

首次使用时自动创建多维表格，包含以下字段：

字段名	类型	说明
录音标题	文本	Get笔记原标题
录音日期	日期	录音创建时间
录音类型	单选	谈案/会议/课堂/电话/闪念/本地
时长(分钟)	数字	录音时长
一级分类	单选	AI自动分类
二级分类	单选	AI自动分类
录音概要	文本	蒸馏产出
知识要点	文本	蒸馏产出
法规引用	文本	蒸馏产出
行业数据	文本	蒸馏产出
案例素材	文本	蒸馏产出
标签	多选	自动+手动
待办事项	文本	录音中的行动项
隐私级别	单选	P0已脱敏/P1已确认/P2无敏感/P1待确认
处理状态	单选	待处理/已蒸馏/已入库/需确认
Get笔记ID	文本	溯源用
入库时间	日期	写入时间

详细建表指南见 references/bitable-setup.md

4.2 IMA知识库（可选，语义搜索）

在 config.json 中设置 ima.enabled = true 并填入 kb_id 后启用。蒸馏后的知识要点会自动创建IMA笔记并添加到指定知识库。

4.3 飞书知识库（可选，团队共享）

在 config.json 中设置 feishu_wiki.enabled = true 并填入 space_id 后启用。蒸馏后的内容会自动创建飞书文档并挂载到知识库空间。

执行模式

模式A：单条处理

用户：处理一下昨天那条XX录音
→ 拉取指定录音 → 隐私审查 → 蒸馏 → 沉淀

模式B：批量扫描

用户：把Get笔记里的录音都处理一下
→ 拉取全部录音 → 对比已处理列表 → 按batch_size逐批处理
→ 跳过时长<skip_short_duration_seconds的超短录音

模式C：定时自动（cron）

cron触发 → 扫描auto_scan_hours内新录音 → 自动处理
→ P1内容发确认给所有者 → 确认后完成入库
→ 超时按default_p1_action处理

模式D：搜索召回

用户：搜一下之前录音里关于XX的内容
→ 搜索飞书多维表格（结构化）+ IMA知识库（语义）→ 返回结果

模式E：查看统计

用户：我的录音处理了多少了？
→ 读取processed_notes.json → 统计已处理/待处理/各分类占比

已处理记录追踪

追踪文件：processed_notes.json

自动记录每条已处理录音的ID、处理时间、隐私状态、各平台入库状态，防止重复处理。

首次运行引导流程

当检测到 config.json 中 bitable.app_token 为空时，自动执行：

询问用户职业（用于优化蒸馏提示词）→ 写入 config.json
创建飞书多维表格「Get笔记录音知识台账」+ 全部17个字段
写入配置 → app_token/table_id/url 写入 config.json
询问可选配置 → IMA知识库？飞书知识库？自定义分类？
试跑一条 → 自动选最新一条录音跑全流程，让用户看到效果

环境变量

变量	说明	必需
`GETNOTE_API_KEY`	Get笔记API密钥（格式：gk_live_xxx）	✅
`GETNOTE_CLIENT_ID`	Get笔记客户端ID（格式：cli_xxx）	✅
`IMA_OPENAPI_CLIENTID`	IMA知识库客户端ID	可选（启用IMA同步时需要）
`IMA_OPENAPI_APIKEY`	IMA知识库API Key	可选（启用IMA同步时需要）

飞书的凭证由 OpenClaw 飞书通道统一管理，无需额外配置。

常见问题

Q：Get笔记API Key怎么获取？

访问 biji.com 开发者后台申请。需要Get笔记会员。

Q：没有飞书怎么办？

目前多维表格依赖飞书。未来版本会支持更多平台（Notion、本地CSV等）。

Q：录音转写不准怎么办？

蒸馏环节会自动纠正转写中的常见错别字和专业术语错误。如果原始转写质量太差，蒸馏结果也会标注"转写质量较低，建议人工核实"。

Q：处理一条录音需要多长时间？

取决于录音长度和模型速度，通常30秒-2分钟/条。

Q：已处理的录音可以重新处理吗？

可以。指定录音说"重新处理XX"，会覆盖之前的结果。

安全红线

🔴 原始转写文本永远不直接入知识库 — 必须经过隐私审查+蒸馏
🔴 P0级敏感信息必须自动脱敏 — 不等所有者确认
🔴 P1级信息未确认前不入库 — 默认按脱敏处理
🔴 隐私审查报告必须存档 — 可追溯、可审计
🔴 录音音频文件本身不上传知识库 — 只处理转写文本
🔴 Get笔记API凭证不写入任何日志或知识库 — 仅在运行时使用