Install
openclaw skills install @shuxiangfanclaw/scrapling-fetch-pro专业网页抓取工具,完整支持微信公众号文章爬取、自动模式检测、噪音清理。适合抓取博客、新闻、公告及各类有反爬保护的网站。
openclaw skills install @shuxiangfanclaw/scrapling-fetch-pro专业版网页抓取工具,完整支持微信公众号文章爬取,智能模式检测,噪音清理。
# 自动模式(推荐)
python3 scripts/scrapling_fetch.py https://example.com/article --mode auto
# 微信公众号文章(自动识别)
python3 scripts/scrapling_fetch.py https://mp.weixin.qq.com/s/xxx
# 指定字符数
python3 scripts/scrapling_fetch.py https://example.com/article 50000
# 强制 stealth 模式
python3 scripts/scrapling_fetch.py https://protected-site.com --mode stealth
# JSON 输出
python3 scripts/scrapling_fetch.py https://example.com --json
按优先级自动尝试:
#js_content - 微信公众号正文 ⭐.rich_media_content - 微信公众号备选 ⭐article - HTML5 article 元素main - HTML5 main 主元素.post-content - 博客常见内容区域.article-content - 新闻常见内容区域.entry-content - WordPress 常见.post-body - 文章正文.content-body - 内容正文 ⭐[class*='body'] - 包含 "body" 的类名[class*='content'] - 包含 "content" 的类名[class*='article'] - 包含 "article" 的类名 ⭐#content - content ID#main - main ID.content - content 类 ⭐body - 最后回退自动移除以下内容:
| 包名 | 版本 | 用途 |
|---|---|---|
| scrapling | 0.4.2 | 爬虫核心框架 |
| html2text | 2025.4.15 | HTML 转 Markdown |
| playwright | 1.58.0 | 浏览器自动化 |
| patchright | 1.58.2 | Playwright 补丁 |
| beautifulsoup4 | 4.12.3 | HTML 解析/噪音清理 ⭐ |
| lxml | 6.0.2 | XML/HTML 解析器 |
| 特性 | 基础版 | 专业版 |
|---|---|---|
| 抓取模式 | basic / stealth | basic / stealth / auto |
| 选择器数量 | 11 个 | 16 个 |
| 微信公众号 | ⚠️ 有限支持 | ✅ 完整支持 |
| 噪音清理 | ❌ | ✅ 微信专用清理 |
| 自动检测 | ❌ | ✅ 智能模式选择 |
# 文章标题
正文内容...
[已自动移除底部广告和工具栏]
版本: 1.2.0
作者: OpenClaw
许可证: MIT (需保留版权声明)
MIT License
Copyright (c) 2026 OpenClaw
Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software.