微信公众号文章爬虫

v1.0.0

微信公众号文章爬虫 - 将微信公号文章转换为 Markdown + 本地图片

0· 387· 1 versions· 2 current· 2 all-time· Updated 18h ago· MIT-0

Install

openclaw skills install wechat-article-spider

wechat-article-spider

微信公众号文章爬虫 - 将微信公号文章转换为 Markdown + 本地图片

执行指令

cd scripts && pip install -r requirements.txt && python main.py

功能

  • ✅ 输入微信公号文章 URL
  • ✅ 自动抓取文章内容
  • ✅ 下载所有图片到 images/ 文件夹
  • ✅ 生成 Markdown 文件,图片使用相对路径引用

安装

cd wechat-article-dl/scripts
pip install -r requirements.txt

用法

命令行

python main.py <文章 URL> [输出目录]

示例

# 下载到当前目录
python main.py https://mp.weixin.qq.com/s/xxxxx

# 指定输出目录
python main.py https://mp.weixin.qq.com/s/xxxxx ./my-articles

输出结构

output/
├── 文章标题.md
└── images/
    ├── img_001_xxx.jpg
    ├── img_002_xxx.png
    └── ...

注意事项

  • 微信文章可能有反爬机制,如遇失败可稍后重试
  • 部分动态加载的图片可能无法获取
  • 图片文件名使用哈希值避免重复

依赖

  • requests
  • beautifulsoup4
  • lxml

Version tags

latestvk97a564zbbyb1p6aqyjn4zx2s182v1e7