Install
openclaw skills install document-managementAnalyze, classify, organize, summarize, and report on PDFs within a given local folder, including batch processing and auto-sorting by topic.
openclaw skills install document-management当用户提供一个包含多个文档的本地目录,并希望:
From user input 管理 D:\测试路径下的文档 → file_path = D:\测试
本技能的目标是处理一个本地文件夹,并输出一份完整报告。
整个流程必须分为三个阶段:
其中:
用户会提供一个本地目录路径,例如:
D:\papers
目录中应包含一个或多个 .pdf 文件。
如果用户提供的是单个文件而不是目录,不要假装支持目录分析。
应明确说明该输入不符合本技能预期。
这一阶段只负责从目录中的 PDF 提取原始文本。
运行脚本,遍历目标目录中的全部 PDF,并提取每篇文档的纯文本。
脚本只负责:
不要把以下逻辑写进 Python:
这些工作都应交给模型完成。
运行脚本:
run {baseDir}/scripts/extract_pdf_folder.py "<folder_path>"
主题数量应根据文档数量动态调整,建议:
分类时应考虑:
优先按研究领域细分,同一领域内可按应用场景或方法论进一步区分。
输入为第一阶段返回的 documents 列表。
逐篇读取 text,判断其最核心主题。
将其加入到对应的文件夹。
在完成文档分类后,必须将每篇 PDF 文件移动到对应的分类文件夹中。
至少形成两类内部结果:
这一阶段根据以下输入生成最终报告:
生成一份完整总报告。
报告应先呈现整体内容,再呈现单篇文档卡片。
不要把单篇卡片单独作为第一结果输出。
默认报告模板文件位于:
references/report-template.md
写报告时,必须先读取并遵循该模板。
如果用户在当前对话中提供了自己的模板,则优先使用用户模板。
如果用户没有提供模板,则使用默认模板。
最终只输出一份完整报告,并保存。
报告中至少应包含:
不要脱离模板自由生成章节结构。
不要擅自增加“文档对比”“差异分析”“优劣比较”等内容,除非用户明确要求。
如果模板中的某个字段无法从文本中得到明确支持,写:
未明确提及
不要为了填满模板而编造内容。