{"skill":{"slug":"wechat-article-scraper","displayName":"微信公众号文章抓取","summary":"在搜狗微信搜索指定关键词，抓取相关文章（标题、摘要、发布日期、来源公众号），生成PDF报告。触发场景：用户要求\"搜索微信文章 关键字 数量","description":"---\nname: wechat-article-scraper\ndescription: 在搜狗微信搜索指定关键词，抓取相关文章（标题、摘要、发布日期、来源公众号），生成PDF报告。触发场景：用户要求\"搜索微信文章 关键字 数量\"\n---\n\n# 微信公众号文章抓取\n\n## 功能概述\n\n通过搜狗微信搜索指定关键词，抓取最新文章，生成带本地PDF的行业报告。\n\n## 触发方式\n\n用户说：\n- \"搜索微信文章 脑机接口\"\n- \"搜索微信文章 人工智能 5\"\n- \"搜索微信文章 光伏 10\"\n\n---\n\n## 完整工作流程\n\n### 第1步：搜索文章\n\n```bash\ncd ~/.openclaw/workspace\npython3 ~/.openclaw/workspace/skills/wechat-article-scraper/scripts/wechat_search.py <关键词> [数量]\n```\n\n- 输出：`articles.json`\n- 包含字段：title, text, url, date, source\n- 默认搜索90天内文章\n\n---\n\n### 第2步：生成摘要（聊天窗口）\n\n⚠️ **重要：summary必须在聊天窗口用当前会话模型生成！**\n\n1. 读取 `articles.json` 中的文章\n2. 用当前模型逐篇生成100-200字摘要\n3. 写入 `articles_new.json`（包含title, text, url, date, source, summary字段）\n\n---\n\n### 第3步：抓取原文PDF\n\n```bash\ncd ~/.openclaw/workspace\npython3 ~/.openclaw/workspace/skills/wechat-article-scraper/scripts/wechat_fetch.py <关键词>\n```\n\n- 输出：`wechat_pages/` 目录下的PDF文件\n- 每篇文章保存为独立的PDF，保留完整样式\n\n---\n\n### 第4步：生成行业报告\n\n```bash\ncd ~/.openclaw/workspace\npython3 ~/.openclaw/workspace/skills/wechat-article-scraper/scripts/wechat_pdf.py <关键词>\n```\n\n- 输出：`<关键词>_行业动态.pdf`\n\n报告包含：\n- 标题、日期\n- 行业动态精选（每篇文章）：\n  - 文章标题\n  - 来源公众号 | 发布日期\n  - 摘要（LLM生成，100-200字）\n  - 链接1：**微信原文（有时效限制）** → 原始微信文章链接\n  - 链接2：**点我看原文(PDF)** → 本地PDF文件\n\n---\n\n## 脚本说明\n\n### scripts/wechat_search.py\n\n- 输入：关键词、数量（默认10）\n- 输出：`articles.json`\n- 功能：使用 Playwright 访问搜狗微信搜索，解析搜索结果并抓取文章正文\n\n### scripts/wechat_fetch.py\n\n- 输入：关键词\n- 输出：`wechat_pages/*.pdf`\n- 功能：读取 `articles_new.json`，抓取每篇文章原文保存为PDF\n\n### scripts/wechat_pdf.py\n\n- 输入：关键词\n- 输出：`<关键词>_行业动态.pdf`\n- 功能：读取 `articles_new.json`，生成带双链接的行业报告PDF\n\n---\n\n## 依赖\n\n```bash\n# 安装 Python 依赖\npip install playwright requests\n\n# 安装 Playwright 浏览器\nplaywright install chromium\n```\n\n---\n\n## 注意事项\n\n1. **摘要必须用LLM生成** - 不能在pdf.py中自动生成\n2. **链接格式** - 微信原文（有时效限制）+ 点我看原文(PDF)\n3. **日期过滤** - 目前默认搜索90天内文章，暂无14天过滤选项\n","topics":["WeChat","微信"],"tags":{"latest":"1.1.1"},"stats":{"comments":0,"downloads":814,"installsAllTime":30,"installsCurrent":3,"stars":0,"versions":3},"createdAt":1773636031127,"updatedAt":1778491936802},"latestVersion":{"version":"1.1.1","createdAt":1773663252241,"changelog":"增加2秒间隔避免请求过快，使用当前会话模型生成摘要","license":"MIT-0"},"metadata":null,"owner":{"handle":"strugglejia","userId":"s178h68hnfva3xab0e9pw6yvyn8852wz","displayName":"StruggleJia","image":"https://avatars.githubusercontent.com/u/33543179?v=4"},"moderation":{"isSuspicious":false,"isMalwareBlocked":false,"verdict":"clean","reasonCodes":["review.llm_review"],"summary":"Review: review.llm_review","engineVersion":"v2.4.24","updatedAt":1780089916358}}