Install
openclaw skills install pdf-vision-readerPDF视觉阅读器 — 将PDF转换为图片,通过AI视觉模型理解PDF内容。 当用户发送PDF文件或提供PDF路径,需要理解、分析、总结PDF内容时使用。 能力: - 将PDF每页渲染为高清PNG图片(PyMuPDF) - 使用AI视觉模型分析图片内容(中英文均可) - 支持幻灯片型、图片型、扫描件型PDF - 自动识别水印、表格、图表、数字 - 输出一页或多页的详细内容描述 使用方式: 1. 接收PDF文件路径或Telegram文件 2. 提取PDF为图片 3. 分批次用视觉AI分析(每批4-5页) 4. 整合结果,可选:摘要整理、要点提炼、知识归档
openclaw skills install pdf-vision-reader用户发送PDF
↓
提取PDF页面为PNG图片(PyMuPDF, 2x缩放)
↓
分批次用视觉AI分析(每批4-5页)
↓
整合视觉分析结果
↓
可选后续处理:
- 整理为结构化摘要
- 提炼关键数据/要点
- 归档至 memory/ 目录
- 回答用户具体问题
建议输出结构:
## PDF内容概览
[总页数] 页,主题:[...]
## 分页详解
### 第X页
[视觉AI返回的详细描述]
## 关键信息提炼
[数据/要点/结论]
## 相关知识
[如果已有相关背景知识,可关联补充]