# 输出文档格式规范

## 概览
本文档定义了图片文字提取器输出的Markdown文档的标准格式和结构规范。

## 标准文档模板

```markdown
# 图片文字提取结果

**提取时间**：YYYY-MM-DD HH:MM:SS  
**图片数量**：N张

---

## 图片1

[图片1的识别文字内容]

保持原有的段落结构...

---

## 图片2

[图片2的识别文字内容]

保持原有的段落结构...

---

## 图片N

[图片N的识别文字内容]

保持原有的段落结构...

---

*文档生成完成*
```

## 格式规则

### 1. 文档头部
- 标题：统一使用"图片文字提取结果"
- 提取时间：使用系统当前时间，格式为 YYYY-MM-DD HH:MM:SS
- 图片数量：统计实际处理的图片总数

### 2. 内容分段
- 每张图片的内容作为一个独立章节
- 章节标题格式：`## 图片N`（N为图片序号，从1开始）
- 图片之间使用分隔线 `---` 进行视觉分隔

### 3. 文字内容处理
- 保持原文段落结构，段落之间使用空行分隔
- 识别到的标题使用对应的Markdown标题格式（`#`、`##`、`###`等）
- 列表内容保持原有格式（有序列表或无序列表）
- 表格内容使用Markdown表格格式

### 4. 特殊情况处理
- 图片无文字：标注"该图片未识别到文字内容"
- 识别失败：标注"该图片识别失败，原因：[具体原因]"
- 文字模糊：在内容前添加提示"注：该图片文字较模糊，识别结果可能存在偏差"

## 完整示例

```markdown
# 图片文字提取结果

**提取时间**：2024-01-15 14:30:25  
**图片数量**：3张

---

## 图片1

### 产品需求文档

#### 一、项目背景

本项目旨在开发一款智能图片文字识别工具，帮助用户快速提取图片中的文字内容。

#### 二、功能需求

1. 支持批量上传图片
2. 自动识别图片中的文字
3. 生成结构化文档输出

---

## 图片2

### 技术方案

**技术栈**：
- Python 3.9+
- OCR引擎
- Markdown生成器

**流程图**：
图片上传 → 文字识别 → 内容整理 → 文档生成

---

## 图片3

### 注意事项

- 图片清晰度影响识别准确率
- 建议图片分辨率不低于 300 DPI
- 支持中英文混合识别

---

*文档生成完成*
```

## 输出方式

### 方式1：直接输出
直接在对话中以Markdown格式输出文档内容，用户可直接复制使用。

### 方式2：生成文件
生成 `.md` 文件供用户下载：
- 文件名格式：`图片文字提取_YYYYMMDD_HHMMSS.md`
- 文件路径：`./图片文字提取_YYYYMMDD_HHMMSS.md`

根据用户需求选择合适的输出方式。