ebook-to-md

Other

Convert PDF/PNG/JPEG/MOBI/EPUB to Markdown. Uses Baidu OCR only. Use when 扫描PDF转Markdown、pdf ocr、图像识别、电子书转Markdown、ebook to markdown.

Install

openclaw skills install ebook-to-md

ebook_to_md Skill

将 PDF、图片、MOBI、EPUB 转为 Markdown。仅使用百度 OCR。

输入格式

PDF：扫描版/图像型 PDF
PNG/JPEG：单张图片
MOBI/EPUB：需安装 Calibre，先转 PDF 再处理

图片 OCR 输出会自动添加 Markdown 分段：首行若为短标题则转为 ##，对话段落前插入空行。

输出格式

仅输出 Markdown（.md）。

参数

Parameter	Type	Required	Default	Description
input_path	string	yes	-	文档路径（pdf/png/jpeg/mobi/epub）或 base64 图片
output_path	string	no	-	输出文件路径
ocr_backend	string	no	"baidu"	保留参数，仅支持百度
inline_images	bool	no	true	图片是否 base64 内联

快速开始

# PDF 转 Markdown（百度 OCR）
python scripts/ebook_to_md.py --input_path=./scanned.pdf
# 图片转 Markdown
python scripts/ebook_to_md.py --input_path=./screenshot.png
# 指定输出路径
python scripts/ebook_to_md.py --input_path=./report.pdf --output_path=./report.md

依赖

Python

pip install requests

系统

Calibre（mobi/epub）：brew install calibre
百度 OCR：设置 BAIDU_OCR_API_KEY、BAIDU_OCR_SECRET_KEY

使用示例

百度 OCR（默认）

from skills.ebook_to_md import main
main(input_path='./report.pdf', output_path='./report.md')
main(input_path='./image.png')  # 图片识别

MOBI/EPUB（需 Calibre）

main(input_path='./book.epub', output_path='./book.md')
main(input_path='./book.mobi', output_path='./book.md')

返回格式

成功：返回字符串，含预览；若指定 output_path 则写入文件。失败：返回 "错误: ..."