Install
openclaw skills install @qqyougitcom/mimo-python-data-analysis拿到一堆数据不知道怎么分析?丢数据进来,自动生成Python分析代码并执行,输出可视化图表和结论。统计建模、时间序列、机器学习全覆盖。不用你会写代码,只要会提问就行。 触发词:数据分析、Python分析、统计分析、数据可视化、数据建模、回归分析、相关性分析、数据清洗、机器学习、聚类分析、预测分析、数据报告 排除:纯Python编程(无数据)、Excel操作(用excel_master)、数据库管理、网页爬虫
openclaw skills install @qqyougitcom/mimo-python-data-analysis分析类型词:
动作词:
场景词:
输入:用户分析需求 处理:
处理:
shape/dtypes/缺失值/基本统计处理:
- 依赖库:pandas/numpy/matplotlib/seaborn/scipy/sklearn/statsmodels
- 图表风格:seaborn白色主题,中文显示
- 图表DPI:150,保存为PNG
- 中文配置:plt.rcParams['font.sans-serif'] = ['SimHei']
校验:
处理:
处理:
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📊 快速分析报告 | {分析目标}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
## 数据概览
样本量:{N} | 特征数:{M}
## 核心发现
{发现1}({数据支撑})
{发现2}({数据支撑})
## 图表
{图表1} | {图表2}
## 结论
{一句话总结}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📊 数据分析报告 | {分析目标}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
## 数据概览
- 样本量:{N} | 特征数:{M}
- 缺失率:{X}%
- 数据类型分布:{分布}
## 质量检查
- ✅ 编码:UTF-8
- ✅ 缺失值:{处理方式}
- ⚠️ 离群值:{检测数量}个(已{处理方式})
## 核心发现
1. **{发现1标题}**
- 数据:{具体数值}
- 解读:{含义}
2. **{发现2标题}**
- 数据:{具体数值}
- 解读:{含义}
3. **{发现3标题}**
- 数据:{具体数值}
- 解读:{含义}
## 统计分析
| 指标 | 数值 | 显著性 |
|------|------|--------|
| {指标1} | {值} | {p值} |
| {指标2} | {值} | {p值} |
## 可视化图表
{图表列表(含文件路径)}
## 建议
1. **{建议1}**
- 依据:{数据支撑}
- 执行:{具体步骤}
2. **{建议2}**
- 依据:{数据支撑}
- 执行:{具体步骤}
## 技术附录
- 分析代码:`analysis_{timestamp}.py`
- 执行时间:{耗时}秒
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
| 异常 | 处理方式 |
|---|---|
| 文件不存在 | 提示检查路径 |
| 编码错误 | 自动尝试多种编码 |
| 列名冲突 | 自动重命名 |
| 数据类型错误 | 尝试转换,失败则跳过 |
| 除零错误 | 返回NaN并提示 |
| 图表生成失败 | 输出纯文本表格替代 |
输入:分析这份销售数据,找出影响业绩的关键因素 输出:
输入:分析一下 输出: 请提供更多信息:
输入:分析这个CSV,但有30%的缺失值 输出: 数据质量警告:
输入:只有5行数据,也要分析 输出: 数据量警告:样本量仅5条
中文输出
| 借口 | 正确做法 |
|---|---|
| "数据量小,跳过数据质量检查直接分析" | 必须完成Step 2数据探查:输出shape/dtypes/缺失值/基本统计,即使数据量<100行也要执行 |
| "缺失值直接dropna删掉就好" | 必须先报告缺失率,<5%可删除,5-30%需评估填充策略,>30%必须告知用户并建议处理方案 |
| "图表用matplotlib默认样式就行" | 必须配置:seaborn白色主题、DPI=150、中文SimHei字体、合理的图表尺寸,禁止使用默认样式 |
| "分析结论写'数据整体呈上升趋势'就行" | 每条结论必须有具体数据支撑(数值+百分比),禁止无数据引用的笼统描述 |
| "代码报错了就告诉用户执行失败" | 执行失败必须自动修正重试(最多3次),常见错误(编码/类型转换/缺失值)应自动处理 |
| "相关性分析看看热力图就够了" | 如用户要求深度分析,必须补充统计检验(p值)、回归分析(R²)、异常值检测(IQR/Z-score) |
| "数据量超过100MB,拒绝分析" | 100MB-1GB应自动采样分析并在报告中说明采样策略,只有>1GB才拒绝并建议分批方案 |