Install
openclaw skills install @haxck/mineru-agent用 MinerU Agent 轻量解析 API 将 PDF/Word/PPT/Excel/图片解析为 Markdown,无需 Token,IP 限频。适用于文档解析、表格提取、OCR 识别。
openclaw skills install @haxck/mineru-agentPDF/Word/PPT/Excel/图片 → 结构化 Markdown
当用户要求解析文档、提取文档内容、OCR 识别、将文件转为 Markdown 时使用。
https://mineru.net/api/v1/agent| 类型 | 格式 |
|---|---|
| 论文、书籍、扫描件 | |
| 📝 Word | .docx |
| 📊 PPT | .pptx |
| 📊 Excel | .xls, .xlsx |
| 🖼️ 图片 | .png, .jpg, .jpeg, .jp2, .webp, .gif, .bmp |
| 限制项 | 限制值 |
|---|---|
| 文件大小 | 10 MB |
| 文件页数 | 20 页 |
直接调用解析脚本:
python3 SKILL_DIR/scripts/mineru_parse.py --url "https://example.com/file.pdf"
可选参数:
--language ch|en (默认 ch)--page_range 1-10(仅 PDF 有效)--output /path/to/output.md(指定输出文件)python3 SKILL_DIR/scripts/mineru_parse.py --file /path/to/document.pdf
用户发送文件或提供文件路径/URL 时,调用脚本解析,将结果返回给用户。
POST /parse/url → 获取 task_idGET /parse/{task_id} → 轮询直到 donePOST /parse/file → 获取 task_id + file_urlPUT file_url → 上传文件到 OSSGET /parse/{task_id} → 轮询直到 done| 错误码 | 说明 | 应对策略 |
|---|---|---|
| -30001 | 文件大小超出限制(10MB) | 拆分文件或告知用户 |
| -30002 | 不支持的文件类型 | 检查文件格式 |
| -30003 | 页数超出限制 | 指定 page_range 拆分 |
| -30004 | 请求参数错误 | 检查必填参数 |
language: chpage_range 分段解析轻量快速,无需 Token!📄