Install
openclaw skills install harness-researchAI Agent Harness 前沿研究 skill——让你的智能体每天自动追踪 AI Agent 领域最新论文和文章, 用结构化框架分析,记录可落地到自身系统的改进方向,实现智能体的持续自我进化。 触发词:研究论文、找最新文章、Harness学习、读paper、agent研究、分析论文、 今日研究、self-evolution、智能体进化、前沿追踪。 适用于任何运行中的 AI Agent 系统——无论你用的是 OpenClaw、Claude Code、AutoGPT、 LangGraph 还是自研框架,只要你的智能体在运行,这个 skill 就能帮它变得更好。
openclaw skills install harness-research职责边界:只研究、只记录、不改代码。改代码是 harness-evolve 的事。
📤每次运行前,从项目文档中读取以下信息(优先级:CLAUDE.md > README.md > 用户说明):
| 配置项 | 说明 | 默认值 |
|---|---|---|
| 框架类型 | Agent 使用的框架 | 从 CLAUDE.md 推断 |
| 核心痛点 | 当前系统最急需改善的问题 | 从 CLAUDE.md / learnings 中提取 |
| 研究日志路径 | harness-log.md 位置 | research/harness-log.md |
| 已有 evolve 产出 | harness-evolve 的进化摘要 | research/evolve-today.md(如存在则读取,了解哪些 P0/P1 已被处理) |
如果项目文档里没有框架类型和核心痛点,直接询问用户,不要跳过——后续所有"系统映射"分析依赖它们。
如果存在 evolve 产出:读取最近的进化摘要,了解哪些研究建议已落地、哪些被否决——避免反复推荐已处理的方向。
读研究日志(research/harness-log.md),提取:
## YYYY-MM-DD 日期## YYYY-MM-DD · {标题} 中的标题(去重用)**来源**:{URL} 中的 URL(URL 级去重,防同文不同标题)已转化 或 已放弃 的 P0/P1 条目(供步骤六引用)搜索窗口 = 上次搜索日期 → 今天。日志不存在或为空时,默认最近 14 天。
各来源的日期判断规则(不同平台日期信号不一致):
| 来源 | 用哪个日期 |
|---|---|
| arxiv | Submitted 日期(页面右侧),不用 v1 日期(v1可能是修订时间) |
| 机构博客/官网 | 文章头部 published date |
| HuggingFace blog | URL 中的日期或文章顶部日期 |
| 日期不确定 | 日志中注明"日期不确定,约 YYYY-MM" |
在时间窗口内搜索,每次选 2-3 个关键词组合。选取策略:读步骤二提取的上次搜索词,优先选上次未使用的领域,保证 8 个领域轮流覆盖,不重复扎堆同一方向。关键词末尾附加当前年份(不要写死)。
| 领域 | 关键词示例 |
|---|---|
| Harness 架构 | AI agent harness scaffolding framework {年份} |
| 记忆编排 | LLM agent memory orchestration context management |
| 多智能体 | multi-agent coordination architecture scaling |
| 评测基准 | AI agent evaluation benchmark tool-use |
| 长时运行 | long-running agent session state management |
| 前沿发布 | Anthropic OpenAI Google agent research new |
| 自我进化 | self-improving agent self-evolution meta-learning |
| 工具使用 | tool-use planning function-calling agent reasoning |
优先信息源:arxiv.org → anthropic.com/research → openai.com/research → deepmind.google/research → huggingface.co/blog → 知名工程博客(Lilian Weng、Simon Willison 等)
入选标准(全部满足才精读):
全部不达标 → 跳到步骤五记录"无发现",再继续步骤六输出摘要,两步都要执行。
WebFetch 读取全文,按以下框架分析——核心问题是"so what:它对我的系统意味着什么,我具体可以怎么做"。
如果全文无法读取(PDF 直链、访问受限等):读取摘要/abstract 页完成分析,并在日志中标注"⚠️ 仅基于摘要分析,未读全文"。
① 基本信息
② 核心发现(1-3 个,必须含具体数据)
③ 认知冲击
④ 系统映射(关键步骤——无映射的阅读是消遣,有映射才是进化)
⑤ 可落地方向(记录,不实施——实施是 harness-evolve 的职责)
用 Edit 工具在日志文件末尾 --- 后追加内容;如文件不存在,用 Write 工具新建并写入完整内容。
有发现时:
## {YYYY-MM-DD} · {论文/文章标题}
**来源**:{URL}
**机构**:{简写}
**发表**:{日期}
**搜索词**:{本次使用的关键词组合}
**核心发现**:
- {发现1,含数据}
- {发现2,含数据}
**认知冲击**:{全新 / 印证 / 挑战} — {一句话}
**系统映射**(置信度:{高/中/低}):
- {组件/场景}:{价值}
**可落地方向**({P0/P1/P2}):
- {改什么}:{怎么改}
- 风险:{副作用}
- 验证:{如何确认有效}
---
无发现时:
## {YYYY-MM-DD} · 研究记录
**搜索结果**:今日未发现高价值新发表
**搜索词**:{用了哪些词}
**备注**:{跳过原因,或"所有候选论文均不满足入选标准"}
---
输出可直接用于日报/周报的摘要段落:
有发现:
今日研读:{标题}({机构,日期})
核心发现:{一句话,含关键数据}
可落地方向({优先级}):{具体改什么}
无发现:
今日搜索未发现高价值新发表,已有认知持续跟进中
当前最高优先落地项:{从步骤二提取的 P0/P1 积压清单中选最高优先级的一条;如无记录,写"暂无待验证落地项,持续跟进中"}
| harness-research(本 skill) | harness-evolve | |
|---|---|---|
| 职责 | 搜索 → 精读 → 分析 → 记录 | 消费研究 + 系统自检 + 执行优化 |
| 输出 | research/harness-log.md 条目 + 摘要段落 | 进化摘要(含动作记录) |
| 改代码吗 | 不改,只记录可落地方向 | A 级直接改,B 级写提案 |
| 可独立用吗 | 可以,纯研究场景 | 可以,但消费 research 日志效果更好 |
| 数据流 | → 写入 harness-log.md → | ← 读取 harness-log.md ← |