# 图片表格数据提取

## 1. 识别图片内容
1. 检查是否存在访问密钥KETOP_KEY_TOKEN，如果没有密钥，提示用户向开普检测申请密钥，并等带用户提供密钥，获得有效密钥并保存，继续执行任务
2. 获得访问密钥KETOP_KEY_TOKEN，设置临时环境变量KETOP_KEY_TOKEN=<密钥>
3. 获得图片绝对路径'imgpath'，使用下面命令获得图片内容：
```bash
python scripts/imgread.py -f imgpath
```

## 2. 提取表格数据
根据识别结果提取表格数据：
- 保持所有数据的原始格式（不修改任何值）
- 保留表头信息
- 记录表格的行列结构

## 3. 过滤数据
- 扫描所有单元格数据
- 移除内容为"pass"（不区分大小写）、"通过"的单元格内的文字或单元格
- 保持其他数据不变

## 4. 输出表格格式
将提取的数据以 Markdown 表格格式输出：
```markdown
| 列名1 | 列名2 | 列名3 |
|-------|-------|-------|
| 数据1 | 数据2 | 数据3 |
| 数据4 | 数据5 | 数据6 |
```

## 5. 输出CSV格式
将提取的数据以 CSV 格式输出：
```csv
列名1,列名2,列名3
数据1,数据2,数据3
数据4,数据5,数据6
```

## 注意事项

### 输出方式
- 应该同时输出表格形式直接展示和CVS格式数据给用户

### 数据完整性
- **不修改数据**：保持所有数据的原始格式和内容
- **保留表头**：如果图片中有表头，必须在输出中保留
- **完整提取**：提取所有可见的表格数据，不遗漏任何单元格，也不要添加任何数据

### 过滤规则
- 仅移除明确为"pass"（不区分大小写）、“通过”的单元格
- 不移除空单元格（除非原表格中没有）
- 不移除其他数据

### 格式要求
- 表格格式：使用标准 Markdown 表格语法
- CSV格式：遵循标准CSV规范，确保可被电子表格软件正确解析
- 两种格式的数据内容应完全一致

## 使用示例

### 示例1：试验数据提取
用户上传包含试验数据提取的图片

**执行流程**：
1. 检测到图片 → 继续
2. 识别表格内容 → 提取表格中的试验数据
3. 过滤"pass"数据 → 移除标记为pass的记录
4. 输出表格格式
5. 输出CSV格式

**表格输出**：
```markdown
| 表头1 | 表头2 | 表头3 |
|------|------|------|
| 数据1 | 数据2 | 数据3 |
| 数据4 | 数据5 | 数据6 |
```

**CSV输出**：
```csv
表头1,表头2,表头3
数据1,数据2,数据3
数据4,数据5,数据6
```

### 示例2：多列表格
用户上传包含多列数据的复杂表格

**处理要点**：
- 准确识别所有列
- 保持列顺序
- 处理包含特殊字符的数据（在CSV中用引号包裹）
