Install
openclaw skills install article-fetcher抓取微信公众号、小红书、豆瓣、知乎文章,自动上传 OSS 图片,LLM 智能提取关键词,一键存档到 Notion
openclaw skills install article-fetcher抓取微信公众号、小红书、豆瓣、知乎文章,自动上传 OSS 图床,LLM 智能关键词提取,一键存档到 Notion。
pip install -r requirements.txt
~/.openclaw/.env)# 必需:OSS 图床
ALIYUN_OSS_AK=your_ak
ALIYUN_OSS_SK=your_sk
ALIYUN_OSS_BUCKET_ID=your_bucket
ALIYUN_OSS_ENDPOINT=oss-cn-shanghai.aliyuncs.com
# 必需:Notion 存档
NOTION_API_KEY=secret_xxx
NOTION_ARTICLE_DATABASE_ID=database_id
# 可选:LLM 关键词提取(OpenAI 兼容接口,与 video-summarizer 共用配置)
LLM_API_KEY=sk-your-api-key
LLM_BASE_URL=https://api.deepseek.com
LLM_MODEL=deepseek-v4-pro
# 可选:Cookies(反爬,Netscape 格式)
WECHAT_COOKIES_FILE=~/.cookies/wechat_cookies.txt
ZHIHU_COOKIES_FILE=~/.cookies/zhihu_cookies.txt
cd <skill-dir>
python3 main.py "文章 URL" [标签1] [标签2]
支持平台:微信公众号 (mp.weixin.qq.com)、小红书 (xiaohongshu.com / xhslink.com)、豆瓣 (douban.com)、知乎 (zhihu.com)
URL → 平台识别 → 内容抓取 → 图片上传 OSS → 关键词提取 (LLM → 词频降级) → Notion 存档
| 字段 | 类型 | 说明 |
|---|---|---|
| Title | title | 文章标题(≤200 字符) |
| Source | rich_text | 来源平台 |
| Author | rich_text | 作者 |
| Link | url | 原文链接 |
| Tags | multi_select | 自动提取关键词 + 手动标签 |
| PubDate | date | 发布时间 |
| Words | number | 字数统计(剔除 HTML) |
| ts | date | 存档时间(东八区) |
YYYY-MM-DD HH:MM:SS,缺失时留空(不伪造)main.py 可作 Python 模块调用:from main import fetch_and_archive_articleDASHSCOPE_API_KEY 时,文章内容会发送至 DashScope API(仅用于关键词提取)fetchers/ 下创建 xxx_fetcher.py,继承 BaseFetcher 实现 fetch_article()detector/platform_detector.py 的 ALLOWED_HOSTS 添加平台域名main.py 的 FETCHER_REGISTRY 注册