Install
openclaw skills install @xueylee-dotcom/deep-research-v22Conducts thorough research by downloading full PDFs, extracting structured data with original text quotes, verifying sources, and generating cross-validated...
openclaw skills install @xueylee-dotcom/deep-research-v22版本:2.2.0 描述:真深度研究技能,强制全文解析+结构化提取+溯源验证
没有真正的原文阅读,就没有深度研究
research/plan.md禁止跳过此步骤!
对于每个有效来源,必须执行:
获取全文
# 使用 extract-from-pdf.py 脚本
python3 scripts/extract-from-pdf.py card-001 "https://arxiv.org/pdf/xxx.pdf"
full_text: false 并跳过该来源结构化提取(从PDF原文提取)
更新卡片
full_text: true/false最低要求:
生成报告前必须运行:
bash scripts/check-sourcing.sh reports/final-report.md sources/
[[card-xxx]] 引用的数据是否在卡片中存在analysis/synthesis.mdreports/final-report.md| 工具 | 用途 | 状态 |
|---|---|---|
| pdfplumber | PDF全文解析 | ✅ 已安装 |
| pdftotext | PDF备用解析 | ✅ 已安装 |
| extract-from-pdf.py | 结构化数据提取 | ✅ 已创建 |
| check-sourcing.sh | 溯源验证 | ✅ 已创建 |
# Step 1: 规划
# 编辑 research/plan.md,确认检索式
# Step 2: 检索 + 提取(循环执行)
# 对于每个来源:
python3 scripts/extract-from-pdf.py card-001 "URL"
# 检查提取结果,填入卡片
# Step 3: 溯源验证
bash scripts/check-sourcing.sh reports/final-report.md sources/
# Step 4-5: 分析与报告
# 生成最终报告
如果无法获取全文(付费论文/报告):
full_text: false| 维度 | v2.1 | v2.2 |
|---|---|---|
| PDF解析 | ❌ | ✅ 强制 |
| 数据提取 | "待提取" | ✅ 真实提取 |
| 原文引用 | 模板话术 | ✅ 从正文复制 |
| 溯源检查 | ❌ | ✅ 强制验证 |
| 报告质量 | 有引用无验证 | 有引用+验证 |
# 1. 检查卡片数量(≥10个有全文的)
FULLTEXT_COUNT=$(grep -l "full_text: true" sources/card-*.md 2>/dev/null | wc -l)
if [ $FULLTEXT_COUNT -lt 10 ]; then
echo "❌ 错误:全文提取卡片不足10个,当前 $FULLTEXT_COUNT 个"
exit 1
fi
# 2. 检查溯源
bash scripts/check-sourcing.sh reports/final-report.md sources/
if [ $? -ne 0 ]; then
echo "❌ 错误:报告中有数据无法溯源"
exit 1
fi
# 3. 检查待提取标记
if grep -q "待提取" sources/card-*.md; then
echo "❌ 错误:卡片中仍有'待提取'数据"
exit 1
fi
Skill版本:2.2.0 | 最后更新:2026-03-19