Install
openclaw skills install ecommerce-data-scraper-pro智能数据抓取工具 - 从网页/API 提取结构化数据,支持批量处理
openclaw skills install ecommerce-data-scraper-pro从网页、API 自动提取结构化数据,支持批量处理和多种输出格式。
# 抓取单个网页
uv run scripts/data-scraper.py scrape --url "https://example.com/products" --selector ".product"
# 抓取多个页面
uv run scripts/data-scraper.py scrape --urls-file urls.txt --output data.json
# 从 API 获取数据
uv run scripts/data-scraper.py api --endpoint "https://api.example.com/data" --auth "Bearer TOKEN"
# 指定输出格式
uv run scripts/data-scraper.py scrape --url "https://example.com" --format csv --output products.csv
# 设置请求延迟(避免被封)
uv run scripts/data-scraper.py scrape --url "https://example.com" --delay 2
# 使用代理
uv run scripts/data-scraper.py scrape --url "https://example.com" --proxy "http://proxy:port"
# 定时抓取
uv run scripts/data-scraper.py scrape --url "https://example.com" --schedule "0 */6 * * *"
| 类型 | 描述 | 示例 |
|---|---|---|
product | 电商产品 | 价格、名称、评分、库存 |
article | 新闻/博客 | 标题、作者、日期、内容 |
job | 招聘信息 | 职位、公司、薪资、要求 |
real_estate | 房产信息 | 价格、面积、位置、户型 |
social | 社交媒体 | 帖子、评论、点赞数 |
custom | 自定义 | 通过 CSS/XPath 选择器定义 |
{
"url": "https://example.com",
"scrapedAt": "2026-02-28T01:13:00Z",
"data": [
{
"title": "产品标题",
"price": "$99.99",
"rating": 4.5
}
]
}
title,price,rating,url
产品标题,$99.99,4.5,https://...
| 版本 | 功能 | 价格 |
|---|---|---|
| 基础版 | 单次抓取,100 页/月 | $49 |
| 专业版 | 批量抓取,1000 页/月,定时任务 | $149 |
| 企业版 | 无限抓取,API 访问,定制支持 | $499 |
输入:
uv run scripts/data-scraper.py scrape \
--url "https://amazon.com/s?k=wireless+headphones" \
--type product \
--fields "title,price,rating,reviews" \
--output headphones.json
输出:
{
"scrapedAt": "2026-02-28T01:13:00Z",
"count": 50,
"data": [
{
"title": "Sony WH-1000XM5",
"price": "$349.99",
"rating": 4.7,
"reviews": 12453
}
]
}
输入:
uv run scripts/data-scraper.py scrape \
--url "https://linkedin.com/jobs/search?keywords=python+developer" \
--type job \
--fields "title,company,location,salary" \
--output jobs.csv
⚠️ 合法合规使用
开发者: VIC ai-company
许可: MIT
支持: 联系 main agent