中文AI知识管理
v1.0.1中文 AI 增强知识管理。PREFIX 确定性分类 + hash/语义去重 + jieba 自动标签 + LLM 对话知识提取。
⭐ 0· 443·2 current·2 all-time
by@romeosy
MIT-0
Download zip
LicenseMIT-0 · Free to use, modify, and redistribute. No attribution required.
Security Scan
OpenClaw
Benign
medium confidencePurpose & Capability
名称/描述、命令行接口和代码文件(parser/classifier/dedup/writer/tagger 等)都匹配“日志到知识库”的用途。要求 node 二进制和 (可选的)SiliconFlow embedding APIKey 与语义去重功能一致。代码包含大量测试,功能边界明确(核心离线、AI 为可选)。
Instruction Scope
运行时指令会读取/写入工作区下的 memory/, backups/, output/, memory/kb/ 等路径(这是预期行为)。extract 命令会将对话 dump 发送到 LLM 提取草稿(SKILL.md 要求人工审阅后 import,这很好)。需要注意:技能在启用 --semantic 或 extract 时会把条目文本发送到外部服务(embeddings / LLM),这会把日志内容传出主机,用户需确认是否可接受。
Install Mechanism
清单中没有自动下载安装脚本(instruction-only 的 install 规范缺失),但包里有 package.json/package-lock 和 node 脚本,典型做法是用户在技能目录运行 npm install。没有看到从不明 URL 下载或执行可疑二进制的安装步骤。
Credentials
registry metadata / SKILL.md 列出的必需环境变量为 SILICONFLOW_API_KEY(用于语义去重),这与 embedding 功能相符。但 README 和 DEFAULT_CONFIG 也引用了 ARK_API_KEY(用于 LLM 提取)与可选的其它 provider 设置,而这些在技能元数据中未声明为“required”。即:LLM 功能需要额外的 API Key(可选),而这未在元数据中完整列出。启用 AI 功能会将日志内容发送给第三方(SiliconFlow 或配置的 LLM 提供商);这种网络访问是合理的用途但具有数据泄露风险,应由用户决定是否授信对应服务商。
Persistence & Privilege
技能未要求 always:true,也未尝试修改其他技能或系统配置。它会在工作区内创建/修改 km.config.json、kb 文件、sync-state.json、embeddings-cache 等属于自身域的文件,这是与其功能成比例的持久化行为。agent 可自治调用(disable-model-invocation:false),但这是平台默认。
Assessment
这个技能看起来是按其描述实现的:离线核心 + 可选 AI 增强。安装/使用前请确认以下几点:
- 数据外发:任何使用 --semantic(embedding)或 extract(LLM) 的操作都会把日志文本或其嵌入发送到外部 API(默认示例为 siliconflow 的 embeddings endpoint,LLM endpoint 需用户在配置中指定)。不要在未授权或含敏感信息的日志上启用这些选项。
- 环境变量:SKILL.md / registry 只声明了 SILICONFLOW_API_KEY,但代码/README 也会尝试读取 ARK_API_KEY(LLM)。如果你要使用 LLM extract,请显式设置并验证 ARK_API_KEY 和 endpoint;技能会把未设置的 envvar 替换为空字符串(不会报错但会导致请求失败或使用错误的 provider)。
- 运行与安装:技能依赖 Node.js;在安装时运行 npm install(或通过 clawhub install),并在受控/隔离的工作区中初始化(km init)以避免意外读取主机上其它目录。
- 审核流程:extract 会生成 output/kb-draft-*.md;SKILL.md 明确要求“必须人工审阅后才能 import” —— 严格遵守这一点可以阻止不可信的 LLM 提取直接写入知识库。
- 代码审计建议:若担心隐私或数据泄露,快速检查 lib/semantic-dedup.js 和 lib/extractor.js(这两个文件会包含对外 HTTP 调用的具体实现和 endpoint),并查看 package.json 以确认依赖项。若你不能或不愿将数据发到默认/第三方服务,可以仅使用离线核心(不传 --semantic、不运行 extract)。
总体判断:功能与声明一致、没有明显的恶意行为,但在启用 AI 功能前请确认并信任你将要使用的第三方 API。若你希望我更精确地评估网络调用细节,可以将 lib/extractor.js 和 lib/semantic-dedup.js 的完整内容贴出,我会检查它们是否包含外部端点、认证头或其他潜在敏感数据泄露路径。Like a lobster shell, security has layers — review code before you run it.
aivk97bxxe2wkcb7dhep6mmfk3a4d81y6cnchinesevk97bxxe2wkcb7dhep6mmfk3a4d81y6cnjiebavk97bxxe2wkcb7dhep6mmfk3a4d81y6cnknowledge-managementvk97bxxe2wkcb7dhep6mmfk3a4d81y6cnlatestvk97750ws8a19y5jj6qdyn9wgjs820y2rmemoryvk97bxxe2wkcb7dhep6mmfk3a4d81y6cnnlpvk97bxxe2wkcb7dhep6mmfk3a4d81y6cnopenclawvk97bxxe2wkcb7dhep6mmfk3a4d81y6cn
License
MIT-0
Free to use, modify, and redistribute. No attribution required.
Runtime requirements
Binsnode
EnvSILICONFLOW_API_KEY
