Install
openclaw skills install universal-data-analyst基于数据本体论自动识别数据类型,生成分析方案及脚本,输出数据质量报告和多格式智能分析报告,支持多种数据格式。
openclaw skills install universal-data-analyst一个基于数据本体论的智能数据分析技能。不依赖关键词硬编码,每次分析均通过大模型进行推理判断,自动识别数据类型、选择分析方法、生成分析脚本并输出报告。
支持经济型数据(零售、订阅、金融等)和非经济型数据(科学测量、社交网络、文本等),可处理 CSV、Excel、Parquet、JSON 等多种格式。
上传数据文件,或发送以下类型的消息即可触发:
.csv / .xlsx / .parquet / .json 文件第一层:数据本体论(Data Ontology)
↓ 这是关于什么的存在?实体类型?生成机制?
第二层:问题类型学(Problem Typology)
↓ 描述型 / 诊断型 / 预测型 / 规范型 / 因果型?
第三层:方法论映射(Methodology Mapping)
↓ 匹配领域公认分析框架
第四层:验证与输出(Validation & Output)
数据质量报告 + 分析脚本 + HTML/MD报告
每一层都调用大模型进行推理,不使用任何硬编码规则。
| 步骤 | 内容 | 说明 |
|---|---|---|
| 1 | 数据加载 | 自动识别格式,支持多种文件类型 |
| 2 | 本体识别 | LLM 判断数据实体类型和生成机制 |
| 3 | 质量校验 | 自动检测缺失值、异常值、重复行等问题,输出质量评分 |
| 4 | 方案规划 | LLM 结合用户诉求选择分析框架和路径 |
| 5 | 脚本生成 | LLM 生成可执行的 Python 分析脚本 |
| 6 | 执行分析 | 运行脚本,生成图表和数值结果 |
| 7 | 综合报告 | 输出 HTML + Markdown 双格式报告 |
每个步骤都有状态追踪和错误处理:
如果某一步骤失败,您会看到:
⚠️ 流程已中断!
原因: 关键步骤 '数据加载' 失败: 编码错误
修复建议:
1. 文件编码可能不是UTF-8,尝试手动指定encoding参数
2. 常见中文编码: gbk, gb2312, gb18030
| 数据特征 | 识别为 | 自动匹配框架 |
|---|---|---|
| 订单 + 价格 + SKU | 零售经济 | 价值链 / ABC-XYZ / RFM |
| 用户 + 订阅周期 + Churn | 订阅经济 | LTV / Cohort / 留存曲线 |
| 点击 / 加购 / 购买事件链 | 注意力经济 | 漏斗分析 / AARRR |
| GMV + 平台撮合 | 佣金经济 | 双边网络效应 / 单位经济 |
| 职位 + 技能 + 薪资 | 劳动力市场 | 技能溢价 / 经验弹性 |
| OHLCV 价格数据 | 金融时序 | 技术分析 / 波动率模型 |
| 数据类型 | 自动匹配框架 |
|---|---|
| 传感器 / 时序连续数据 | 时间序列分解、极值分析 |
| 社交 / 网络关系数据 | 中心性分析、社区发现 |
| 地理 / 空间数据 | 空间自相关、热点分析 |
| 文本语料 | 主题模型、情感分析 |
| 生物医学数据 | 生存分析、差异表达 |
.csv, .tsv, .txt)- 自动编码检测,支持 utf-8、gbk、latin1 等.xlsx, .xls).parquet, .pq).json)CSV 文件加载时自动尝试多种编码:
每次分析生成以下内容:
session_YYYYMMDD_HHMMSS/
├── step2_ontology_prompt.txt # 本体识别提示词(可复用)
├── step3_validation_report.json # 数据质量报告
├── step3_cleaning_report.txt # 数据清洗建议
├── step4_planning_prompt.txt # 分析方案提示词(可复用)
├── step5_script_prompt.txt # 脚本生成提示词(可复用)
├── analysis_report.html # 综合 HTML 报告(含图表)
├── analysis_report.md # Markdown 报告
└── charts/ # 所有分析图表(PNG)
用户:帮我分析一下这份销售数据,想了解哪些商品卖得好、哪些客户价值高
[上传 orders.csv]
Skill 自动完成:
用户:这是我们 App 的用户行为日志,想看看用户转化漏斗
[上传 events.csv]
Skill 自动完成:
用户:帮我分析这份气象站观测记录,了解温度和降水的规律
[上传 weather.csv]
Skill 自动完成:
pandas >= 1.3
numpy >= 1.21
matplotlib >= 3.4
seaborn >= 0.11
scipy >= 1.7
openpyxl >= 3.0 # Excel 支持
chardet >= 4.0 # 编码自动检测(可选,但推荐)
pyarrow >= 6.0 # Parquet 支持(可选)
sqlalchemy >= 1.4 # SQL 支持(可选)
v1.1.0 · 作者:Claude · 许可证:CC BY-NC-SA 4.0