Install
openclaw skills install wechat-article-full-reader读取微信公众号文章,提取全文内容和图片,结合阅读分析。当用户提供 mp.weixin.qq.com 链接、让看公众号文章内容、或需要分析微信文章的文字和图片时使用。
openclaw skills install wechat-article-full-reader微信公众号使用懒加载机制,图片真实URL存储在 data-src 属性中。本skill提供完整的文章阅读流程:提取全文 + 内容图片 + 结合分析。
agent-browser open "<文章URL>"
微信文章使用懒加载,需要滚动到底部触发所有图片加载:
# 多次滚动确保加载完成
for i in {1..8}; do
agent-browser scroll down 800
sleep 1
done
// 提取标题、作者、正文
const title = document.querySelector('#activity-name')?.innerText || '未找到标题';
const author = document.querySelector('#js_name')?.innerText || '';
const content = document.querySelector('#js_content')?.innerText || '';
执行方式:
agent-browser eval "<上述JS代码>"
微信图片存储在 data-src 属性,不在 src:
// 提取所有懒加载图片的真实URL
const imgs = document.querySelectorAll('img');
const urls = [];
imgs.forEach((img) => {
const dataSrc = img.getAttribute('data-src');
if (dataSrc && dataSrc.startsWith('http')) {
urls.push(dataSrc.split('#')[0]); // 去掉hash
}
});
urls.join('\n');
内容图片特征:
mmbiz.qpic.cn 域名装饰图片特征(排除):
# 创建目录
mkdir -p <输出目录>
# 下载图片
curl -o "img-01.png" "<图片URL>"
使用 scripts/read_article.sh 一键执行:
./scripts/read_article.sh "<文章URL>" <输出目录>
输出:
article.json - 标题、作者、正文images/ - 内容图片目录summary.md - 结合阅读摘要| 类型 | 特征 | 处理 |
|---|---|---|
| 内容图片 | 尺寸 > 200px, 来自 mmbiz.qpic.cn | 下载并分析 |
| 装饰分隔 | 高度 < 50px 或 文件 < 2KB | 忽略 |
| 公众号图标 | 含 "yZPTcMGWibvsic9Obib" 等固定路径 | 忽略 |
| 表情包/贴纸 | 尺寸 < 100px | 忽略 |
## 文章标题
**作者:** XXX
### 正文 + 图片
> 段落内容...
配图:[图片描述]
> 继续段落...
### 图片汇总
| 图片 | 内容 | 关联段落 |
|------|------|----------|
| img-01.png | 游戏截图 | 第一节 |
| img-02.png | 数据图表 | 第三节 |