Install
openclaw skills install weibo-scraper抓取指定微博用户的帖子内容。当用户提到"抓微博"、"微博内容"、"看微博"、"weibo"、"某人微博"等关键词时使用此 skill。支持按日期筛选、自动获取长文全文、滚动加载防遗漏。基于 m.weibo.cn 移动端 + browser 工具实现,无需登录即可抓取公开微博。
openclaw skills install weibo-scraper抓取微博用户帖子的浏览器自动化工作流。
使用 browser 工具访问 m.weibo.cn(移动端),无需登录即可查看公开微博。移动端比 PC 端结构简单、反爬弱、渲染快。
如果已知 UID,跳到步骤 2。
否则,用 browser 导航到 https://m.weibo.cn/search?luicode=10000011&lfid=100103type%3D1%26q%3D{URL编码的昵称},在搜索结果中找到用户主页链接,从中提取 UID(格式为 /u/{UID} 或 /profile/{UID})。
navigate → https://m.weibo.cn/u/{UID}
页面加载后,snapshot 可见帖子列表。帖子结构:
banner 块中heading 元素中,格式如 4-17 08:37 来自 微博网页版article 元素中link "全文" 元素,URL 为 /status/{微博ID}遍历 snapshot 中的所有帖子,匹配 .time heading 中的日期部分(如 4-17)。
注意:日期格式为 M-D,不补零(如 4-17 不是 04-17)。跨年帖子会显示年份(如 2025-12-28)。
短帖:主页 snapshot 中的 article 内容即为完整文本。
长帖(有"全文"链接):
/status/{微博ID} 中的微博IDnavigate → https://m.weibo.cn/status/{微博ID}主页默认只显示最近的约 10 条帖子。如果目标日期的帖子不在首屏:
window.scrollTo(0, document.body.scrollHeight)
执行后等 1-2 秒再 snapshot,检查是否加载了更多帖子。重复滚动直到目标日期的帖子全部出现。
抓取完成后,关闭本次打开的浏览器标签页:
browser → close → targetId: {当前标签页的 targetId}
释放资源,避免残留标签页占用内存。
按时间从早到晚排序,每条帖子标注序号和发布时间:
① HH:MM
[正文内容]
② HH:MM
[正文内容]
m.weibo.cn/api/container/getIndex 会被 432 反爬拦截M-D 不补零,如 4-17 而非 04-17