Install
openclaw skills install vadeepresearch系统化深度研究技能。适用于需要联网研究、市场分析、竞品分析、行业研究、技术调研、论文/开源项目梳理、报告写作前置调研、PPT/文档/方案生成前的信息搜集与深度分析。当用户提出深度分析xxx、帮我分析xxx、快速分析xxx、深度研究xxx、详细分析xxx等话术时使用该 skills。Use when the user asks for deep research, comprehensive analysis, market/competitive/industry research, or content generation that requires current real-world evidence.
openclaw skills install vadeepresearch本技能用于把“单次搜索式回答”升级为“多角度检索、多源交叉验证、结构化综合分析、可追溯报告输出”的深度研究流程。
核心原则:
当用户出现以下意图时启用:
Use this skill for:
开始研究前,先从用户需求中抽取:
| 字段 | 说明 |
|---|---|
| Topic / 主题 | 研究对象是什么 |
| Scope / 范围 | 市场、技术、论文、竞品、政策、应用、风险等 |
| Depth / 深度 | 快速、标准、深度 |
| Time Range / 时间范围 | 最新、今年、近三年、历史演进等 |
| Geography / 地域 | 全球、中国、美国、欧洲、某行业/区域 |
| Output / 输出 | 简答、表格、研究报告、PPT素材、方案、Markdown文档等 |
| Language / 语言 | 默认跟随用户语言 |
若用户没有明确范围,不要停在追问;先按最合理的通用框架执行,并在输出中说明默认范围。
| 深度 | 适用场景 | 检索要求 | 输出要求 |
|---|---|---|---|
| 快速研究 | 用户要快速了解 | 至少 3 个有效来源,2-3 个角度 | 结论 + 证据摘要 |
| 标准研究 | 普通调研/方案前置 | 至少 5-8 个有效来源,3-5 个角度 | 结构化分析 + 表格 + 来源 |
| 深度研究 | 报告、决策、市场/竞品分析 | 至少 10 个有效来源,5-10 个角度,覆盖官方/行业/新闻/学术/案例等 | 完整报告 + 方法论 + 风险 + 建议 |
有效来源指:内容与主题直接相关、可追溯、时效合适、来源可信度可判断。
本技能在 scripts/ 目录下提供 6 个 Python 辅助脚本,覆盖研究全生命周期。在执行各阶段时,应优先调用对应脚本完成结构化任务,避免完全依赖手动推理。
| 脚本 | 职责 | 主要研究阶段 | CLI 用法 |
|---|---|---|---|
orchestrator.py | 任务编排:创建研究任务、管理子智能体、生成研究计划、汇总各角度发现 | Phase 1–2, Phase 6 | python orchestrator.py create <query> [lang] |
research_engine.py | 研究引擎:执行网络搜索/学术搜索、生成查询词、提取发现、评估来源可信度 | Phase 1–3 | python research_engine.py research <topic> [lang] |
progress_manager.py | 进度追踪:创建/更新/读取进度文件、生成可视化进度摘要、列出活跃任务 | 全阶段 | python progress_manager.py show <task_dir> [lang] |
analysis_engine.py | 分析引擎:加载研究数据、提取关键发现、识别模式/趋势/冲突、生成分析报告 | Phase 4–6 | python analysis_engine.py analyze <task_dir> [lang] |
report_generator.py | 报告生成:加载任务元数据/研究发现/分析结果、生成 Markdown 研究报告 | Phase 6 | python report_generator.py generate <task_dir> [lang] |
pdf_converter.py | PDF 转换:将 Markdown 报告转换为 PDF(依赖 md-to-pdf) | 输出后处理 | python pdf_converter.py convert <md_file> [pdf_file] |
使用原则:
orchestrator.py 创建任务目录结构,确保后续各脚本有统一的数据落盘路径。research_engine.py 生成查询词并执行搜索,避免人工枚举查询词遗漏关键角度。progress_manager.py 更新各阶段状态,便于中断后恢复或多人协作。analysis_engine.py 对原始发现进行结构化处理,不能直接将搜索摘要作为结论。report_generator.py 统一生成 Markdown,再由 pdf_converter.py 按需转换 PDF。可用脚本: orchestrator.py(创建任务)、research_engine.py(生成查询词/执行搜索)、progress_manager.py(初始化进度)
目标:快速建立全局图谱。
执行动作:
python scripts/research_engine.py research <topic> 自动生成查询词并执行初步搜索。python scripts/orchestrator.py create <query> 创建任务目录,并在 plan.md 中记录研究角度。python scripts/progress_manager.py 初始化进度文件。常见研究角度:
| 类型 | 推荐角度 |
|---|---|
| 技术调研 | 技术原理、方法分类、关键论文、开源实现、评测指标、工程落地、瓶颈 |
| 市场分析 | 市场规模、增长率、驱动因素、细分市场、区域格局、客户需求 |
| 竞品分析 | 产品定位、核心功能、价格/商业模式、客户群、优势劣势、近期动作 |
| 行业研究 | 产业链、政策环境、供需结构、关键玩家、投资并购、未来趋势 |
| 数据集/论文/开源项目 | 任务定义、数据规模、标注类型、许可、下载方式、代码成熟度、适配成本 |
| 方案/报告生成 | 背景、痛点、目标、路线、架构、指标、风险、里程碑、预算 |
可用脚本: research_engine.py(多源搜索/按角度研究)、orchestrator.py(子智能体配置)
目标:对每个关键角度进行精准检索。
执行动作:
python scripts/research_engine.py 的 generate_search_queries() 生成查询词。python scripts/research_engine.py research <topic> [lang] 执行 multi_source_search(),覆盖 web + academic 来源。python scripts/orchestrator.py 的 create_research_agent_config() 为每个角度创建子智能体配置,落盘到 <task_dir>/research/<angle>_config.json。查询模式:
{topic} market size {current_year}
{topic} industry report {current_year}
{topic} key players competitors
{topic} latest trends {current_year}
{topic} technical survey paper
{topic} benchmark dataset github
{topic} case study deployment
{topic} limitations challenges risks
{topic} policy regulation {region} {current_year}
中文查询示例:
{主题} 市场规模 {当前年份}
{主题} 行业分析 {当前年份}
{主题} 主要厂商 竞争格局
{主题} 技术路线 发展趋势
{主题} 论文 综述 评测
{主题} 开源项目 GitHub
{主题} 应用案例 落地
{主题} 挑战 风险 局限
可用脚本: research_engine.py(多源搜索/来源可信度评估)、progress_manager.py(更新进度)
目标:防止单一来源偏差。
执行动作:
research_engine.py 的 multi_source_search() 同时搜索 web 和 academic 来源,确保覆盖至少 3 类来源类型。_assess_credibility() 自动评估每个来源的可信度(high/medium/low),优先保留 high 可信度来源。progress_manager.py 更新 verification 阶段状态,记录已验证的来源数量和类型。至少覆盖以下来源类型中的 3 类;深度研究尽量覆盖 5 类以上。
| 来源类型 | 价值 | 可信度提示 |
|---|---|---|
| 官方来源 | 公司公告、政府数据、标准、文档 | 高,但可能有宣传倾向 |
| 学术来源 | 论文、综述、会议、arXiv | 方法细节强,需注意是否已验证 |
| 行业报告 | Gartner、IDC、麦肯锡、咨询机构、证券研报等 | 数据完整,但口径可能不同 |
| 权威新闻 | 主流媒体、行业媒体 | 时效好,需辨别二手转述 |
| 开源社区 | GitHub、文档、issue、release | 工程可行性强,需看维护状态 |
| 企业案例 | 客户案例、白皮书、产品页 | 有落地信息,但偏正面 |
| 社区讨论 | Reddit、论坛、博客 | 可发现痛点,但不能单独作为强证据 |
可用脚本: research_engine.py(extract_findings)、orchestrator.py(保存发现到任务目录)
目标:从原始搜索结果中提取结构化证据。
执行动作:
python scripts/research_engine.py 的 extract_findings() 自动从搜索结果中提取关键发现,包括:content, url, title, credibility。python scripts/orchestrator.py 的 save_research_findings() 将每个角度的发现持久化到 <task_dir>/research/<angle_id>.json。对每个重要来源抽取以下字段:
| 字段 | 要求 |
|---|---|
| Source | 来源名称、链接或可引用标识 |
| Date | 发布/更新日期,无法确认则标注“未明确” |
| Claim | 来源给出的关键结论 |
| Data | 数值、指标、样本量、年份、统计口径 |
| Context | 适用场景、地域、行业、技术条件 |
| Confidence | 高/中/低 |
| Notes | 局限、偏差、与其他来源冲突点 |
可用脚本: analysis_engine.py(识别矛盾/模式)、progress_manager.py(更新进度)
执行动作:
python scripts/analysis_engine.py 的 identify_patterns() 自动识别高频主题、趋势和潜在矛盾点。可用脚本: analysis_engine.py(生成洞察)、report_generator.py(生成 Markdown 报告)、pdf_converter.py(转 PDF)、progress_manager.py(完结进度)
目标:将证据组织为可交付的研究报告。
执行动作:
python scripts/analysis_engine.py analyze <task_dir> [lang] 加载所有研究数据,生成 insights.json 和 analysis_report.md。python scripts/report_generator.py generate <task_dir> [lang] 整合元数据、研究发现和分析结果,输出完整的 Markdown 报告到 deepresearch/output/<task_id>/report.md。python scripts/pdf_converter.py convert <md_file> [pdf_file] 完成转换。python scripts/progress_manager.py 将 reporting 阶段标记为 done,并检查所有阶段是否完成。报告内容组织:
研究时必须读取当前日期,并据此设计查询。
| 用户表达 | 查询时间粒度 | 示例 |
|---|---|---|
| 今天、今早、刚发布 | 月 + 日 + 年 | AI news June 5 2026 |
| 本周 | 周范围 | AI chip news week of June 1 2026 |
| 最近、最新 | 月 + 年 / 近 30-90 天 | VLM small object detection June 2026 |
| 今年、趋势 | 年份 | AI infrastructure trends 2026 |
| 历史演进 | 多年份 | development history of ... 2020 2021 2022 2023 2024 2025 2026 |
禁止把“今天/刚发布”降级为年份级查询;这会漏掉当天信息。
默认输出格式:Markdown 文件,文件扩展名使用 .md。
除非用户明确指定其他格式,否则研究结果、分析报告、证据表、参考来源和后续建议均应先以 Markdown 形式输出,便于阅读、审阅、版本管理和后续转换。
默认文件命名建议:
{topic_slug}_research_report.md
默认 Markdown 输出应包含:
在完成 Markdown 输出之后,必须在结尾追加一个简短的“后续格式转换引导”,询问用户是否需要继续转换或二次加工。不要默认直接转换,除非用户已经明确要求。
推荐引导语:
---
## 后续可选处理
我已默认输出 Markdown(`.md`)版本。是否需要我继续转换为以下格式之一?
- Word(`.docx`):适合正式汇报、评审材料、可编辑文档
- PDF(`.pdf`):适合定稿分发、归档和打印
- PPT(`.pptx`):适合汇报展示,可进一步整理成页级结构
- HTML(`.html`):适合网页展示、交互报告或内部知识库
- Excel(`.xlsx`):适合将证据表、竞品表、数据表单独结构化
也可以继续让我提取:摘要版、领导汇报版、PPT大纲、图表清单、参考文献表。
如果用户要求“生成文件”,优先生成 .md 文件并提供下载链接;若用户随后选择 Word/PDF/PPT/HTML/Excel,再调用对应文件生成流程完成转换。
# {主题} 快速研究结论
## 结论摘要
1. ...
2. ...
3. ...
## 关键证据
| 结论 | 证据 | 来源 | 可信度 |
|---|---|---|---|
| ... | ... | ... | 高/中/低 |
## 风险与不确定性
- ...
## 建议
- ...
# {主题} 研究分析
## 1. 执行摘要
- 核心结论 1
- 核心结论 2
- 核心结论 3
## 2. 研究范围与方法
- 研究范围:...
- 时间范围:...
- 来源类型:...
## 3. 分维度发现
### 3.1 {角度一}
### 3.2 {角度二}
### 3.3 {角度三}
## 4. 对比表 / 数据表
| 维度 | A | B | C | 备注 |
|---|---|---|---|---|
## 5. 深度分析
- 驱动因素
- 约束因素
- 机会窗口
- 风险点
## 6. 结论与建议
## 7. 来源与证据表
| 来源 | 日期 | 关键内容 | 可信度 |
|---|---|---|---|
---
title: "{研究主题}深度研究报告"
date: "{当前日期}"
version: "1.0"
---
# 执行摘要
# 1. 研究背景与问题定义
# 2. 研究方法与数据来源
# 3. 关键发现
# 4. 分维度深度分析
# 5. 数据、案例与证据矩阵
# 6. 竞争格局 / 技术路线 / 产业链 / 市场结构
# 7. 风险、限制与不确定性
# 8. 趋势判断与情景推演
# 9. 结论与建议
# 10. 参考来源
输出前必须检查:
未满足检查项时,继续补充检索或在输出中明确说明限制。
| 错误 | 问题 | 修正 |
|---|---|---|
| 只搜 1 次就回答 | 覆盖不足 | 至少多角度、多关键词检索 |
| 只看搜索摘要 | 容易误读 | 打开并阅读高价值来源正文 |
| 只找正面材料 | 结论偏乐观 | 同时检索 challenges / limitations / criticism |
| 不写时间口径 | 数据不可比 | 标注年份、地域、样本、统计范围 |
| 把预测当事实 | 误导决策 | 明确 forecast / estimate / reported / confirmed |
| 使用不可用 API 示例 | 技能不可执行 | 使用宿主环境真实工具;无工具时说明限制 |
| 堆砌来源 | 没有分析价值 | 用证据支撑结论,形成判断 |
searxng.example.com、search.example.com、NewsAPI key 或其他未配置服务。scripts/ 目录下的对应脚本完成结构化任务,避免完全依赖手动推理。例如:
research_engine.pyanalysis_engine.pyreport_generator.pypdf_converter.py 依赖 Node.js 工具 md-to-pdf,转换前需检查 npx md-to-pdf --version 是否可用;不可用时应提示用户安装。<task_dir> 目录共享数据(JSON 文件),确保 orchestrator.py 创建的任务目录结构被后续脚本正确读取。progress_manager.py 更新对应阶段状态,便于中断后恢复。研究角度:
1. 市场定义与边界
2. 市场规模、增长率与预测口径
3. 需求驱动因素
4. 主要玩家与份额
5. 商业模式与价格体系
6. 区域/行业细分
7. 风险、政策、供应链约束
8. 未来 1-3 年趋势与建议
研究角度:
1. 竞品清单与定位
2. 核心功能与技术路线
3. 客户群与使用场景
4. 定价与商业模式
5. 优势、短板、护城河
6. 近期发布、融资、合作、并购
7. 可借鉴点与差异化机会
研究角度:
1. 问题定义与任务边界
2. 主流方法分类
3. 代表论文与核心贡献
4. 数据集、指标与评测结果
5. 开源代码、许可证、维护状态
6. 工程落地难点
7. 适合用户场景的路线建议
研究角度:
1. 项目背景与行业痛点
2. 用户现状与短板
3. 技术路线与可行性
4. 竞品或替代方案对比
5. 关键指标与验收标准
6. 风险与应对措施
7. 预算、里程碑与交付物建议
无论输出长短,都应满足:
.md,便于审阅、版本管理和后续转换。