Install
openclaw skills install @lucky-dreamer/fetch-wechat-article使用 Playwright headed 模式 + 真实系统浏览器抓取微信公众号文章。 当用户给出 mp.weixin.qq.com 链接、说要抓取/下载公众号文章、 或遇到"环境异常"验证页时,必须使用本技能。 本技能会弹出真实浏览器窗口绕过微信反爬,提取文章标题、作者、正文, 并同时保存 .md 和 .html 两种格式。 不依赖微信登录态,所有公众号公开文章都可抓取。
openclaw skills install @lucky-dreamer/fetch-wechat-article抓取微信公众号文章的专用技能。在 headed 模式下使用系统安装的 Edge 浏览器,真实渲染页面来绕过微信的反爬检测(headless 模式会被"环境异常"页面拦截)。
用户提供微信公众号文章链接,格式通常为:
https://mp.weixin.qq.com/s/xxx(短链接)https://mp.weixin.qq.com/s?__biz=xxx&mid=xxx&...(长链接,带追踪参数)两种都可以直接使用,但优先使用短链接(长链接中的 sharer_shareinfo 等追踪参数不影响抓取)。
python <skill_dir>/scripts/fetch_wechat_article.py [--browser auto|chromium|firefox] <文章URL> [输出目录]
脚本会:
navigator.webdriver).md 和 .html 到输出目录Linux 用户提示:默认使用 Firefox,如想用 Chromium 可加
--browser chromium参数。 无图形界面的服务器会自动启用 headless 模式。
脚本输出到终端:
保存的文件:
wechat_标题_时间戳.md — 结构清晰的 Markdown 文件,含标题、作者、时间、正文wechat_标题_时间戳.html — 带干净排版的 HTML 页面,可直接浏览器打开查看抓取完成后,告知用户保存的文件路径和基本信息:
playwright install msedge 或 playwright install chromiumpip install playwright
playwright install msedge