Install
openclaw skills install pdf-image-text-extractor从图片或 PDF 文档中识别并提取文字内容,支持多种图片格式和 PDF 文件,自动判断是否包含文字并保留原始格式输出结构化结果;当用户需要从图片或 PDF 提取文字、进行 OCR 识别、处理含文字的文档或转换为可编辑文本时使用
openclaw skills install pdf-image-text-extractor脚本所需的依赖包及版本:
pymupdf>=1.23.0
安装命令:
pip install pymupdf>=1.23.0
接收图片
识别图片内容
read_image 工具识别图片内容判断文字存在性
提取并整理文字
接收 PDF 文件
调用脚本提取文字
python scripts/pdf_text_extractor.py <pdf_file_path>处理提取结果
格式化输出
.md 文件用户操作:上传一张包含文字的图片
智能体处理:
read_image 工具识别图片用户操作:上传 PDF 并要求"提取这个 PDF 的文字"
智能体处理:
python scripts/pdf_text_extractor.py ./document.pdf./extracted_from_pdf.md用户操作:上传扫描版 PDF
智能体处理: