Install
openclaw skills install cn-scrapling高性能自适应 Python 网页抓取框架,内置反爬虫绕过(Cloudflare Turnstile)、智能元素重定位、完整爬虫框架和 MCP 服务器,适合 AI 辅助数据提取和大规模爬取任务
openclaw skills install cn-scraplingScrapling 是 Google Chrome DevTools 生态之外最强大的 Python 网页抓取框架之一,能够处理从单次 HTTP 请求到大规模并发爬取的所有场景。它的自适应解析引擎在网页改版后自动重新定位元素,内置 Cloudflare Turnstile 绕过能力,Spider 框架支持暂停/恢复,并提供 MCP 服务器让 AI 直接辅助数据提取,从源头减少 Token 消耗。
StealthyFetcher 内置 Cloudflare Turnstile 绕过,支持 TLS 指纹伪装和浏览器自动化auto_save=True 保存元素快照,adaptive=True 自动重新定位变化元素DynamicFetcher 基于 Playwright,支持完整浏览器自动化和网络空闲等待pip install scrapling 并按需安装浏览器驱动Fetcher/StealthyFetcher/DynamicFetcherauto_save 实现自适应使用本技能时,AI 可以:
scrapling install playwright / scrapling install camoufox)auto_save=True 和 adaptive=True 实现自适应抓取Fetcher(快速 HTTP)、StealthyFetcher(反爬绕过)、DynamicFetcher(浏览器自动化)spider.stream() 实时推送抓取结果,适合大规模任务ProxyRotator,支持循环或自定义策略FetcherSession/StealthySession/DynamicSession 跨请求保持状态from scrapling.fetchers import Fetcher, StealthyFetcher, DynamicFetcher
# 普通 HTTP 抓取(最快)
page = Fetcher.get('https://quotes.toscrape.com/')
quotes = page.css('.quote .text::text').getall()
# 隐身模式绕过 Cloudflare
page = StealthyFetcher.fetch('https://protected-site.com', headless=True)
data = page.css('.content::text').get()
# 自适应抓取(网站改版后自动重定位)
page = Fetcher.get('https://example.com/products')
products = page.css('.product', auto_save=True) # 首次保存元素快照
# 网站改版后:
products = page.css('.product', adaptive=True) # 自动重新定位
# CLI 快速测试(无需写代码)
scrapling fetch https://quotes.toscrape.com/ --css ".quote .text"
# 启动 MCP 服务器
scrapling mcp
| 依赖 | 版本要求 |
|---|---|
| Python | >= 3.9 |
| pip | 任意版本 |
| Playwright | 可选(DynamicFetcher 使用) |
| Camoufox | 可选(StealthyFetcher 使用) |
| Docker | 可选(使用官方镜像) |