Get笔记炼金术

Get笔记炼金术 — 将Get笔记中的录音笔记(谈案、会议、课堂、电话) 经过隐私审查→内容蒸馏→结构化沉淀→多端归档,转化为可复用的知识数字资产。 适用人群:律师、咨询师、培训师、销售等大量使用录音记录工作的专业人士。 触发条件: (1) 用户说"处理录音""录音转知识库""录音沉淀""消化录音""录音炼金" (2) 用户说"Get笔记同步飞书""录音归档""录音整理" (3) 定时任务触发:自动扫描新录音并处理 (4) 用户指定某条录音笔记进行处理 核心能力:隐私保护、内容蒸馏、知识分类、多端沉淀(飞书多维表格+IMA知识库+飞书知识库) 依赖:Get笔记App + OpenClaw + 飞书(可选IMA知识库) 环境变量:GETNOTE_API_KEY、GETNOTE_CLIENT_ID

Audits

Pass

Install

openclaw skills install getnote-alchemy

Get笔记炼金术 — 录音→知识数字资产

💡 一句话说明:你的Get笔记里躺着几十上百条录音,每条都是"数字垃圾"。 这个技能把它们自动变成可搜索、可复用、有隐私保护的知识资产。

快速开始

30秒上手

  1. 确保已安装 Get笔记App 并开通录音转写
  2. 配置环境变量:GETNOTE_API_KEYGETNOTE_CLIENT_ID获取方式
  3. 对 Agent 说:"处理我的录音" — 首次运行会自动创建飞书多维表格

就这么简单。Agent会自动拉取你的录音 → 隐私审查 → 蒸馏知识 → 写入多维表格。

进阶配置(可选)

编辑 config.json 解锁更多能力:

  • 🧠 IMA知识库同步(语义搜索,问答时自动召回)
  • 📚 飞书知识库同步(团队共享文档)
  • 🏷️ 自定义分类体系(适配你的行业)
  • 🔒 隐私策略调整(脱敏规则、确认超时)
  • ⚙️ 处理参数(批量大小、最短时长过滤)

总览

Get笔记录音 → 隐私审查 → 内容蒸馏 → 分类归档 → 多端沉淀
   (输入)      (Step 1)    (Step 2)    (Step 3)    (Step 4)

一条录音的完整旅程:

  1. Get笔记App录音 → 自动转写+AI摘要
  2. OpenClaw拉取录音笔记详情
  3. 🔴 隐私审查:扫描敏感信息,标记/脱敏/提醒所有者
  4. 内容蒸馏:从转写文本中提炼知识点、案例、法规、数据
  5. 分类归档:按领域自动分类
  6. 多端沉淀:飞书多维表格(结构化检索)+ 可选IMA知识库 + 可选飞书知识库

Step 1:拉取录音笔记

1.1 扫描新录音

从Get笔记API拉取录音类型笔记,筛选未处理的:

GET https://openapi.biji.com/open/api/v1/resource/note/list?cursor=0

录音类型过滤(note_type):

  • audio — 即时录音(谈案、电话)
  • meeting — 会议录音
  • class_audio — 课堂录音(培训、讲座)
  • local_audio — 本地音频文件
  • recorder_audio — 录音卡长录
  • recorder_flash_audio — 录音卡闪念

1.2 获取笔记详情

GET https://openapi.biji.com/open/api/v1/resource/note/detail?id={note_id}

关键字段提取:

字段路径内容用途
data.note.title标题录音主题
data.note.contentAI摘要+正文蒸馏输入
data.note.audio.transcript完整转写文本蒸馏输入(主要)
data.note.audio.duration时长(秒)元数据
data.note.tags自动标签分类参考
data.note.created_at创建时间归档时间
data.note.note_type录音类型场景分类

1.3 认证配置

Headers:
  Authorization: $GETNOTE_API_KEY
  X-Client-ID: $GETNOTE_CLIENT_ID

⚠️ 笔记ID是int64,JavaScript中必须当字符串处理,防止精度丢失。


Step 2:🔴 隐私审查(最关键环节)

铁律:任何录音内容在蒸馏和沉淀之前,必须先过隐私审查。

2.1 敏感信息三级分类

级别类型处理方式
🔴 P0-绝对禁止身份证号、银行卡号、密码、当事人真名+案情自动脱敏,不等确认
🟡 P1-需确认客户名称、具体金额、商业策略、诉讼策略提醒所有者确认后再入库
🟢 P2-可入库法律条文、公开案例、行业通用数据、操作流程直接入库

2.2 审查流程

转写文本
  ↓
自动扫描 → 识别P0/P1/P2内容
  ↓
P0内容 → 自动脱敏
P1内容 → 生成「隐私确认清单」→ 通知所有者确认
P2内容 → 直接进入蒸馏环节
  ↓
所有者确认P1(超时默认脱敏)
  ↓
生成「隐私审查报告」存档

详细的隐私审查规则、脱敏方法、审查报告模板见 references/privacy-rules.md


Step 3:内容蒸馏

目标:从原始转写文本中提炼出可复用的知识资产,不是存原文。

3.1 蒸馏产出物(7项)

产出物说明
📋 录音概要3-5句话概括核心内容
🎯 知识要点可复用知识点(3-10条)
⚖️ 法规引用涉及的法律法规条文
📊 行业数据提到的数据/统计信息
📁 案例素材可复用的实务经验
🏷️ 标签自动分类标签
待办事项录音中的行动项

3.2 蒸馏提示词

详见 references/distill-prompts.md,包含:

  • 通用蒸馏提示词(所有录音)
  • 谈案专项提炼(客户画像、服务方案、风险点)
  • 课堂专项提炼(知识框架、易错点)
  • 会议专项提炼(决策、分歧、跟进)

3.3 默认分类体系

一级分类二级分类示例
法律诉讼、合同、知产、劳动
财税税务筹划、税务争议、财务分析
金融投融资、并购、跨境
行业客户管理、AI应用、培训学习

可在 config.json 中自定义分类体系。


Step 4:多端沉淀

4.1 飞书多维表格(必选,结构化检索)

首次使用时自动创建多维表格,包含以下字段:

字段名类型说明
录音标题文本Get笔记原标题
录音日期日期录音创建时间
录音类型单选谈案/会议/课堂/电话/闪念/本地
时长(分钟)数字录音时长
一级分类单选AI自动分类
二级分类单选AI自动分类
录音概要文本蒸馏产出
知识要点文本蒸馏产出
法规引用文本蒸馏产出
行业数据文本蒸馏产出
案例素材文本蒸馏产出
标签多选自动+手动
待办事项文本录音中的行动项
隐私级别单选P0已脱敏/P1已确认/P2无敏感/P1待确认
处理状态单选待处理/已蒸馏/已入库/需确认
Get笔记ID文本溯源用
入库时间日期写入时间

详细建表指南见 references/bitable-setup.md

4.2 IMA知识库(可选,语义搜索)

config.json 中设置 ima.enabled = true 并填入 kb_id 后启用。 蒸馏后的知识要点会自动创建IMA笔记并添加到指定知识库。

4.3 飞书知识库(可选,团队共享)

config.json 中设置 feishu_wiki.enabled = true 并填入 space_id 后启用。 蒸馏后的内容会自动创建飞书文档并挂载到知识库空间。


执行模式

模式A:单条处理

用户:处理一下昨天那条XX录音
→ 拉取指定录音 → 隐私审查 → 蒸馏 → 沉淀

模式B:批量扫描

用户:把Get笔记里的录音都处理一下
→ 拉取全部录音 → 对比已处理列表 → 按batch_size逐批处理
→ 跳过时长<skip_short_duration_seconds的超短录音

模式C:定时自动(cron)

cron触发 → 扫描auto_scan_hours内新录音 → 自动处理
→ P1内容发确认给所有者 → 确认后完成入库
→ 超时按default_p1_action处理

模式D:搜索召回

用户:搜一下之前录音里关于XX的内容
→ 搜索飞书多维表格(结构化)+ IMA知识库(语义)→ 返回结果

模式E:查看统计

用户:我的录音处理了多少了?
→ 读取processed_notes.json → 统计已处理/待处理/各分类占比

已处理记录追踪

追踪文件processed_notes.json

自动记录每条已处理录音的ID、处理时间、隐私状态、各平台入库状态,防止重复处理。


首次运行引导流程

当检测到 config.jsonbitable.app_token 为空时,自动执行:

  1. 询问用户职业(用于优化蒸馏提示词)→ 写入 config.json
  2. 创建飞书多维表格「Get笔记录音知识台账」+ 全部17个字段
  3. 写入配置 → app_token/table_id/url 写入 config.json
  4. 询问可选配置 → IMA知识库?飞书知识库?自定义分类?
  5. 试跑一条 → 自动选最新一条录音跑全流程,让用户看到效果

环境变量

变量说明必需
GETNOTE_API_KEYGet笔记API密钥(格式:gk_live_xxx)
GETNOTE_CLIENT_IDGet笔记客户端ID(格式:cli_xxx)
IMA_OPENAPI_CLIENTIDIMA知识库客户端ID可选(启用IMA同步时需要)
IMA_OPENAPI_APIKEYIMA知识库API Key可选(启用IMA同步时需要)

飞书的凭证由 OpenClaw 飞书通道统一管理,无需额外配置。


常见问题

Q:Get笔记API Key怎么获取?

访问 biji.com 开发者后台申请。需要Get笔记会员。

Q:没有飞书怎么办?

目前多维表格依赖飞书。未来版本会支持更多平台(Notion、本地CSV等)。

Q:录音转写不准怎么办?

蒸馏环节会自动纠正转写中的常见错别字和专业术语错误。如果原始转写质量太差,蒸馏结果也会标注"转写质量较低,建议人工核实"。

Q:处理一条录音需要多长时间?

取决于录音长度和模型速度,通常30秒-2分钟/条。

Q:已处理的录音可以重新处理吗?

可以。指定录音说"重新处理XX",会覆盖之前的结果。


安全红线

  1. 🔴 原始转写文本永远不直接入知识库 — 必须经过隐私审查+蒸馏
  2. 🔴 P0级敏感信息必须自动脱敏 — 不等所有者确认
  3. 🔴 P1级信息未确认前不入库 — 默认按脱敏处理
  4. 🔴 隐私审查报告必须存档 — 可追溯、可审计
  5. 🔴 录音音频文件本身不上传知识库 — 只处理转写文本
  6. 🔴 Get笔记API凭证不写入任何日志或知识库 — 仅在运行时使用