Install
openclaw skills install pdf-highlight-extractor识别用户发来的 PDF 文档中的高亮标注内容(荧光笔标记),提取所有高亮文字, 汇总后生成一个带 YAML Front Matter(title、date、tags 三件套)的 Markdown 文件。 title 和 tags 由 AI 根据内容语义自动生成;Markdown 包含「摘录原文」和「内容总结」两部分。 输出文件保存在与 PDF 相同的目录下,文件名为 <pdf名>_highlights.md。 当用户发来 PDF 并提到「提取高亮」「整理标注」「读取标记」「生成读书笔记」等意图时使用此技能。
openclaw skills install pdf-highlight-extractor从用户提供的 PDF 文件中提取所有高亮(荧光笔)标注文字,汇总后生成带 YAML Front Matter 的 Markdown 文档。
首次使用时,先运行安装脚本确保 pymupdf 已安装:
<python> scripts/install_deps.py
其中 <python> 替换为当前环境的 Python 路径(优先使用 managed 版本)。
用 JSON 模式运行提取脚本,获得结构化的高亮数据供后续 AI 处理:
<python> scripts/extract_highlights.py "<pdf_path>" --json
<pdf_path>:用户提供的 PDF 绝对路径page(页码)、color(颜色名)、text(内容)--color yellow(支持 yellow/green/red/blue/pink/orange/purple/cyan)分析所有高亮文本的语义,生成:
按以下模板在 PDF 同目录生成 <pdf文件名>_highlights.md:
---
title: "<AI生成的标题>"
date: <今日日期 YYYY-MM-DD>
tags:
- <tag1>
- <tag2>
- ...
---
# <标题>
## 摘录原文
### 第 N 页
- 高亮内容1
- 高亮内容2
### 第 M 页
- ...
---
## 内容总结
<AI 根据所有高亮内容撰写的 200~400 字综合总结,提炼核心观点、关键数据和重要结论>
告知用户: