# 图表类型选择指南

## 目录
- [概览](#概览)
- [柱状图](#柱状图)
- [折线图](#折线图)
- [饼图](#饼图)
- [散点图](#散点图)
- [直方图](#直方图)
- [选择决策树](#选择决策树)

## 概览
本文档提供不同图表类型的适用场景、数据要求和最佳实践，帮助智能体根据数据特征推荐最合适的图表类型。

## 柱状图

### 适用场景
- 比较不同类别之间的数值大小
- 展示随时间变化的离散数据
- 显示类别间的差异和排名

### 数据要求
- 至少包含一个分类列和一个数值列
- 分类数量建议不超过15个（过多会导致图表拥挤）

### 示例数据结构
| 产品名称 | 销售额 |
|---------|-------|
| 产品A   | 1000  |
| 产品B   | 1500  |
| 产品C   | 800   |

## 折线图

### 适用场景
- 展示数据随时间的连续变化趋势
- 显示多个系列的变化对比
- 强调数据的变化率和趋势

### 数据要求
- 包含一个有序的X轴（时间、年龄、等级等）
- 至少一个数值列作为Y轴
- 数据点应该有逻辑顺序

### 示例数据结构
| 月份 | 收入 | 支出 |
|-----|------|------|
| 1月  | 5000 | 3000 |
| 2月  | 6000 | 3500 |
| 3月  | 5500 | 3200 |

## 饼图

### 适用场景
- 展示各部分占整体的比例
- 强调相对份额而非绝对数值
- 类别数量较少时（建议不超过10个）

### 数据要求
- 一个分类列和一个数值列
- 所有数值的总和应该有意义（代表整体）
- 分类数量建议控制在10个以内

### 示例数据结构
| 部门 | 预算占比 |
|-----|---------|
| 研发  | 40%     |
| 销售  | 30%     |
| 行政  | 20%     |
| 其他  | 10%     |

## 散点图

### 适用场景
- 探索两个变量之间的关系和相关性
- 识别数据中的异常值和聚类
- 展示数据的分布模式

### 数据要求
- 至少两个数值列
- 数据点数量足够多以显示模式

### 示例数据结构
| 广告投入 | 销售额 |
|---------|-------|
| 100     | 500   |
| 200     | 900   |
| 150     | 700   |

## 直方图

### 适用场景
- 展示单个变量的分布情况
- 识别数据的中心趋势和离散程度
- 检查数据是否符合正态分布

### 数据要求
- 单个数值列
- 数据点数量建议不少于30个

### 示例数据结构
| 考试分数 |
|---------|
| 85      |
| 92      |
| 78      |

## 选择决策树

```
开始
  │
  ├─ 只有1个数值变量？
  │   └─ 是 → 直方图
  │
  ├─ 有2个变量？
  │   ├─ 都是数值？
  │   │   └─ 是 → 散点图
  │   │
  │   └─ 1个分类 + 1个数值？
  │       ├─ 分类数量 ≤ 10？
  │       │   ├─ 关注占比？ → 饼图
  │       │   └─ 关注绝对值？ → 柱状图
  │       │
  │       └─ 分类数量 > 10 → 柱状图
  │
  └─ 有3个或更多变量？
      ├─ 有时间/有序变量？ → 折线图
      ├─ 需要比较类别？ → 柱状图
      └─ 探索变量关系？ → 散点图矩阵
```

## 智能推荐提示

在为用户推荐图表类型时，考虑以下问题：
1. 用户想要展示什么信息？（比较、趋势、分布、占比）
2. 数据中有哪些类型的变量？（分类、数值、时间序列）
3. 数据的规模如何？（类别数量、数据点数量）
4. 目标受众是谁？（需要考虑可读性和专业性）
