Install
openclaw skills install wechat-article-conversion微信公众号文章抓取与转换,支持 Markdown/HTML/Text/JSON/Excel 五种格式。 触发条件:用户发送微信文章链接(https://mp.weixin.qq.com/s/xxx)、 多链接(换行分隔)、或「帮我转这篇文章」「保存微信文章」等表达。 格式选择前必须询问用户,支持单选或多选。
openclaw skills install wechat-article-conversion将微信文章转换为离线的 Markdown/HTML/Text/JSON/Excel,无需登录,直接抓取,图片和样式本地化保留。
用户发送:
https://mp.weixin.qq.com/s/xxx用户: https://mp.weixin.qq.com/s/xxx
→ 询问: "请选择导出格式(支持单选或多选,例如:1 或 1,3,5 或 markdown,html)"
可选格式:
| 序号 | 格式 | 扩展名 | 说明 |
|---|---|---|---|
| 1 | Markdown | .md | 带标题/作者/日期/来源链接 |
| 2 | Excel | .xlsx | 表格,含元信息+正文(行高300px) |
| 3 | HTML | .html | 独立网页,CSS+图片本地化,浏览器直接打开 |
| 4 | 纯文本 | .txt | 无格式纯文字 |
| 5 | JSON | .json | 结构化,含完整元数据 |
格式选择解析(不区分大小写):
2 / excel / Excel1,3,5 / markdown,html,json / 1 和 3HTML 是离线阅读效果最好的格式,结构如下:
文章标题_文章ID/
├── index.html # 完整网页(CSS引用+图片引用)
└── assets/ # 资源文件夹
├── *.css # 样式文件(18个,共约3MB)
└── *.jpg/png/webp # 图片文件
生成策略:
<!DOCTYPE><html><head><body>)assets/,用时间戳文件名href="./assets/xxx"#js_content 的 visibility:hidden 样式自动移除(防空白页)#js_article_bottom_bar 底部栏自动保留<style> 保底样式(字体/行高/图片自适应)mp.weixin.qq.com,Referer 必须带域名CSS 处理策略:
<style>(单文件方便分享)assets/ 用 <link> 引用(避免 HTML 臃肿)已知限制:
~/Desktop/文章标题_文章ID/~/Desktop/微信文章批量/# 单篇(单格式)
python skills/wechat-article/scripts/fetch_article.py <url> [format] [output_dir]
# format: markdown | html | text | json | excel
# 批量(多链接)
python skills/wechat-article/scripts/batch_fetch.py <urls_file> [formats_csv]
data-src(懒加载),同步到 src;空 img 标签自动移除