# PDF和图片文字提取 / pdf-image-text-extractor

---

## 简介

从图片或 PDF 文档中识别并提取文字内容，支持多种图片格式和 PDF 文件，自动判断是否包含文字并保留原始格式输出结构化结果。

**核心价值**

- **双格式覆盖**：同时支持图片（PNG、JPG、GIF、WebP 等）和 PDF 文档，一个工具搞定两类场景。
- **格式保留**：提取时尽量保持原文的段落结构、标题层级和排版顺序，减少二次整理。
- **灵活输出**：可直接查看提取结果，也可保存为 Markdown 文件，按需选择。

**适用对象**

- 📄 **办公人士** — 快速从扫描件、截图中提取可编辑文字，免去手动录入。
- 🎓 **学生 / 研究者** — 从 PDF 论文、课件中提取文字内容，便于引用与整理。
- 💼 **内容创作者** — 从图片素材中获取文字素材，转为可编辑文本再加工。

---

## 功能特性

### 核心功能

- **图片文字识别**：上传图片后自动检测并提取其中的标题、正文、注释、水印等所有文字内容，保持原有排版。
- **PDF 文字提取**：从文字版 PDF 中提取全部页面文本，保留段落结构与标题层级，输出为 Markdown 格式。
- **文字存在性判断**：自动判断图片或页面中是否包含可提取文字，无文字时及时告知。
- **多语言支持**：支持识别中文、英文等多种语言文字。
- **扫描版 PDF 检测**：当 PDF 页面为扫描图片时，提示用户该页面无法直接提取，建议使用 OCR 处理。
- **结果保存**：提取结果可按需保存为 `.md` 文件，包含文件来源、提取状态与文字内容。

---

## 使用指南

直接用自然语言描述需求，上传图片或 PDF 即可，无需记忆命令。

### 常用说法速查

| 意图             | 示例话术                             | 效果                                       |
| ---------------- | ------------------------------------ | ------------------------------------------ |
| 提取图片文字     | 「帮我把这张图片里的文字提取出来」   | 识别图片中的所有文字，保持原有排版输出     |
| 提取 PDF 文字    | 「提取这个 PDF 的文字」              | 逐页提取 PDF 文本，保留段落与标题结构      |
| 提取并保存       | 「把这份 PDF 的文字提取出来保存」    | 提取文字并生成 `.md` 文件                  |
| 处理扫描版 PDF   | 「这份扫描件里的文字帮我读出来」     | 检测扫描页面并提示，对可提取部分正常输出   |

---

## 使用场景

| 场景             | 角色           | 示例问法                             | 收益                                     |
| ---------------- | -------------- | ------------------------------------ | ---------------------------------------- |
| 图片文字转可编辑 | 办公人士       | 「截图里有段话，帮我提取出来」       | 免去手动录入，快速获得可编辑文字         |
| PDF 论文摘录     | 学生 / 研究者  | 「把这篇 PDF 的文字提取出来」        | 保留原文结构，方便引用与整理             |
| 扫描件内容获取   | 行政 / 财务    | 「这份扫描件能读出文字吗」           | 自动检测扫描页面，对可提取部分正常输出   |
| 素材文字再加工   | 内容创作者     | 「图片里的文案帮我转成文字」         | 快速获取文字素材，便于二次编辑与发布     |
