微信公众号转个人知识库

将微信公众号文章自动转为个人知识库笔记。输入公众号文章链接，自动抓取正文、AI 多维度总结（摘要/核心观点/金句/标签）、生成结构化 Markdown 笔记并存入本地。

Install

openclaw skills install @afeicn/wechat-article-to-txt

微信公众号文章 → Obsidian 个人知识库

适用场景

当用户发来一个微信公众号文章链接（https://mp.weixin.qq.com/s/...），希望：

保存到 Obsidian 知识库 — 转为结构化 Markdown 笔记
自动总结 — 提取摘要、核心观点、金句、关键数据
自动打标签 — 基于内容生成 Obsidian 标签
建立知识关联 — 生成双向链接建议

工作流程

用户发送公众号文章链接
  │
  ▼
[步骤1] 抓取文章正文
  │   ├─ 用内置脚本提取微信文章 HTML
  │   └─ 解析标题、作者、发布时间、正文内容
  │
  ▼
[步骤2] AI 多维度总结
  │   ├─ 使用 agent 内置能力进行总结
  │   ├─ 生成：摘要(200字) / 核心观点(3-5条) / 金句 / 关键数据
  │   └─ 生成：标签(3-8个) / 相关主题建议
  │
  ▼
[步骤3] 生成 Obsidian Markdown 笔记
  │   ├─ 应用标准笔记模板
  │   ├─ 添加 YAML frontmatter（标题/来源/日期/标签/作者）
  │   └─ 组织为结构化笔记
  │
  ▼
[步骤4] 存入 Obsidian Vault
  │   ├─ 确定 Obsidian vault 路径（从配置文件读取）
  │   ├─ 按「来源/主题/日期」组织目录结构
  │   └─ 写入 .md 文件到 vault

前置条件

本技能依赖以下组件：

1. Node.js + cheerio（文章正文抓取）

npm install -g cheerio

2. Obsidian Vault 路径配置

首次使用需要配置你的 Obsidian vault 路径。默认从 Obsidian 配置文件读取：

cat ~/Library/Application\ Support/obsidian/obsidian.json

你也可以在 scripts/config.json 中手动指定：

{
  "vault_path": "/path/to/your/vault",
  "article_dir": "Inbox/微信公众号",
  "default_tags": ["wechat"],
  "language": "zh"
}

本技能使用 agent 内置的 AI 能力进行总结，无需额外配置 API Key。

使用方法

方式一：发送链接直接处理

用户发送微信公众号文章链接，agent 自动执行全部流程：

用户: https://mp.weixin.qq.com/s/xxxxx
agent: 开始处理这篇文章...
       ✅ 已抓取正文: 《文章标题》
       ✅ 已生成摘要和总结
       ✅ 已存入 Obsidian: Inbox/微信公众号/文章标题.md

方式二：批量处理

用户发送多个链接，agent 逐个处理：

用户: 帮我保存这几篇文章到知识库
      https://mp.weixin.qq.com/s/aaa
      https://mp.weixin.qq.com/s/bbb

方式三：指定主题目录

用户: 把这篇文章存到「AI/大模型」目录下
      https://mp.weixin.qq.com/s/xxxxx

步骤详解

步骤1: 抓取文章正文

使用 scripts/fetch_article.js 抓取微信公众号文章：

node scripts/fetch_article.js "https://mp.weixin.qq.com/s/xxxxx"

输出： 文章原始 JSON 数据（标题、作者、发布时间、正文HTML、正文Markdown）

脚本说明：

使用 cheerio 解析微信文章页面
提取文章标题、公众号名称、发布时间
将正文 HTML 转为纯文本/Markdown（保留图片链接）
自动处理微信反爬机制（User-Agent、Cookie）

备用方案： 如果 cheerio 抓取失败（微信反爬限制），使用 curl 方案：

node scripts/fetch_article_fallback.js "https://mp.weixin.qq.com/s/xxxxx"

步骤2: AI 多维度总结

使用 agent 内置 AI 能力对文章内容进行多维度总结。

总结维度：

维度	说明	长度
摘要	文章核心内容概述	200-300字
核心观点	3-5条主要论点	每条30-50字
金句	原文中值得记录的话	3-5条
关键数据	文章中提到的数字、数据	按需
标签	基于内容自动生成	3-8个
相关主题	与知识库中其他笔记的关联建议	2-5条

Prompt 参考：

请对以下微信公众号文章进行多维度总结，输出 JSON 格式：

文章标题：{title}
公众号：{author}
正文：{content}

请输出以下格式：
{
  "summary": "200-300字的摘要",
  "key_points": ["观点1", "观点2", ...],
  "quotes": ["金句1", "金句2", ...],
  "key_data": ["数据1", "数据2", ...],
  "tags": ["标签1", "标签2", ...],
  "related_topics": ["主题1", "主题2", ...]
}

步骤3: 生成 Obsidian Markdown 笔记

使用 scripts/generate_note.py 生成标准化笔记：

python3 scripts/generate_note.py \
  --title "文章标题" \
  --author "公众号名称" \
  --source "https://mp.weixin.qq.com/s/xxxxx" \
  --date "2026-06-17" \
  --content "文章正文" \
  --summary "{\"summary\":\"...\",\"key_points\":[...]}" \
  --tags "wechat,AI,大模型" \
  --output /path/to/output.md

步骤4: 存入 Obsidian Vault

使用 scripts/save_to_vault.py 写入 Obsidian：

python3 scripts/save_to_vault.py \
  --note /path/to/note.md \
  --vault /path/to/your/vault \
  --dir "Inbox/微信公众号/AI"

或者直接复制到 vault：

cp /tmp/note.md "/path/to/your/vault/Inbox/微信公众号/文章标题.md"

笔记模板

生成的 Obsidian 笔记格式如下：

---
title: "{{title}}"
source: "{{source_url}}"
author: "{{author}}"
date: {{date}}
tags:
  - wechat
  - {{tag1}}
  - {{tag2}}
status: inbox
---

# {{title}}

> **摘要：** {{summary}}

## 📌 核心观点

- {{key_point_1}}
- {{key_point_2}}
- {{key_point_3}}

## 💬 金句

> {{quote_1}}

> {{quote_2}}

## 📊 关键数据

- {{data_1}}

## 📝 笔记与思考

*（在此记录你的思考和延伸阅读）*

## 🔗 相关笔记

- [[相关笔记1]]
- [[相关笔记2]]

## 📎 原文链接

[{{title}}]({{source_url}})

---

*自动收录于 {{date}} | 来源：{{author}}*

目录组织

建议的 Obsidian 知识库结构：

Obsidian Vault/
├── Inbox/
│   └── 微信公众号/
│       ├── AI/
│       │   ├── 文章标题1.md
│       │   └── 文章标题2.md
│       ├── 科技/
│       ├── 财经/
│       └── 未分类/
├── Tags/
│   └── wechat.md          (MOC: Map of Content)
└── Templates/
    └── wechat-article.md   (笔记模板)

一键处理脚本

为方便使用，提供一键处理脚本：

node scripts/process_article.js "https://mp.weixin.qq.com/s/xxxxx"

参数说明：

--dir, -d：指定 Obsidian 子目录（默认 未分类）
--tags, -t：额外添加标签（逗号分隔）
--dry-run, -n：仅预览，不写入 vault
--vault, -v：指定 vault 路径（覆盖配置）
--output, -o：输出到指定文件（不写入 vault）

示例

# 基本用法
node scripts/process_article.js "https://mp.weixin.qq.com/s/xxxxx"

# 指定目录和标签
node scripts/process_article.js "https://mp.weixin.qq.com/s/xxxxx" -d "AI/大模型" -t "深度学习,Transformer"

# 仅预览不保存
node scripts/process_article.js "https://mp.weixin.qq.com/s/xxxxx" --dry-run

# 输出到指定文件
node scripts/process_article.js "https://mp.weixin.qq.com/s/xxxxx" -o ~/Desktop/note.md

配置

默认配置文件位于 scripts/config.json：

{
  "vault_path": "",
  "article_dir": "Inbox/微信公众号",
  "default_tags": ["wechat"],
  "language": "zh",
  "summarize_model": "default",
  "max_content_length": 10000
}

vault_path：Obsidian vault 根目录（留空则自动从 Obsidian 配置读取）
article_dir：文章存放目录（相对于 vault 根目录）
default_tags：默认添加的标签
language：输出语言（zh/en）
summarize_model：总结模型（default 使用 agent 内置能力）
max_content_length：截断过长的文章正文

常见问题

抓取失败

微信文章有反爬机制，如果抓取失败：

文章可能已被删除
需要登录才能查看
微信反爬限制

解决办法：

尝试使用 --fallback 参数重试
手动复制文章内容粘贴给 agent
或者用 curl 带上 Cookie 重试

没有 Obsidian vault

如果没有安装 Obsidian，本技能仍可以：

输出 Markdown 文件到指定目录
生成纯文本格式的知识卡片
后续随时可以导入 Obsidian

目录不存在

如果指定的 vault 子目录不存在，脚本会自动创建。

安全与隐私

所有数据处理在本地完成
文章内容仅用于生成知识笔记
不向第三方发送数据
所有 AI 总结在 agent 内部完成，数据不离开本地

注意事项

请遵守微信公众号平台的使用条款
抓取频率不宜过高，避免触发反爬
文章版权归原作者所有，笔记仅供个人学习使用
建议定期整理 Inbox 目录中的未分类文章