Install
openclaw skills install openclaw-wealth-guide自动采集、处理多种数据源并导出JSON、CSV、Excel等格式,支持定时任务及OpenClaw无缝集成,适合中国市场。
openclaw skills install openclaw-wealth-guide
智能数据采集器是一个专为OpenClaw生态系统设计的自动化数据采集、处理和导出工具。支持多种数据源和导出格式,专为中国市场优化,提供全中文界面和文档。
npx clawhub install data-harvester
git clone https://gitee.com/du-xuegong/openclaw-wealth-guide.git
cd openclaw-wealth-guide
uv pip install -r requirements.txt
# 激活技能
/技能 数据采集器
# 示例命令
采集网页 https://example.com 保存为 data.json
定时采集 https://api.example.com/data 每天 09:00
导出数据为 Excel 报表
from data_harvester import DataHarvester
# 创建数据采集器实例
harvester = DataHarvester()
# 配置数据源
config = {
"sources": [
{
"type": "web",
"url": "https://example.com/data",
"extract_rules": {
"title": "h1",
"content": ".main-content"
}
}
],
"processing": {
"clean_html": True,
"remove_duplicates": True
},
"export": {
"format": "json",
"path": "output/data.json"
}
}
# 执行数据采集
result = harvester.harvest(config)
print(f"采集完成:{result['stats']['total_records']}条记录")
支持多种数据源类型:
支持APScheduler定时任务调度:
from data_harvester.scheduler import Scheduler
scheduler = Scheduler()
scheduler.add_job(
"daily_report",
"cron",
hour=9,
minute=0,
config={
"sources": [...],
"export": {"format": "excel", "path": "reports/daily.xlsx"}
}
)
scheduler.start()
openclaw-wealth-guide/
├── src/data_harvester/
│ ├── adapters/ # 数据源适配器
│ ├── processors/ # 数据处理器
│ ├── exporters/ # 数据导出器
│ ├── scheduler/ # 任务调度器
│ └── openclaw_integration/ # OpenClaw集成
├── tests/ # 测试套件
├── examples/ # 使用示例
├── skill.json # OpenClaw技能清单
└── requirements.txt # Python依赖
A: 在OpenClaw对话中使用 /技能 数据采集器 命令激活技能。
A: 支持Web页面、API接口、数据库和文件四种数据源类型。
A: 主要依赖 requests, beautifulsoup4, pandas, APScheduler 等,完整列表见 requirements.txt。
A: 可以通过Python API设置,或在OpenClaw中使用“定时采集”命令。
A: 支持JSON、CSV、Excel、SQLite和PDF格式。
本项目采用MIT许可证。详见LICENSE文件。
智能数据采集器 - 让数据采集变得简单高效! 🚀