Install
openclaw skills install llm-researcherLLM 论文与项目研究员。分析LLM相关论文和Github项目, 并按指定类目进行分类整理。使用场景:(1) 获取 LLM 领域最新进展,(2) 追踪特定方向的最新研究
openclaw skills install llm-researcher1.在按本skill开始任何步骤前,必须先询问用户:是否已在当前环境安装 Python,并说明用途:运行 scripts/pdf_to_md.py 将论文 PDF 转为 Markdown(终端中需能执行 python 或 python3)。明确告知没有 Python 则无法按规范执行论文 PDF 解析,可请用户安装 Python 后再继续,或在与用户达成一致的前提下仅做不涉及 pdf_to_md.py 的降级(例如只做 GitHub 条目、或跳过需 PDF 的论文条目),并在过程说明与最终报告中写明该限制。
2.询问用户对于每个数据源获取的条目数量。
3.询问用户调用脚本从PDF链接提取markdown是用哪个参数
introduction:仅返回严格匹配 # Introduction 一级标题的 Markdown 内容all:返回整篇论文转换后的完整 Markdown 内容
4.输出报告的语言。
在未完成上述确认前,不要开始执行本 skill 的核心流程。https://www.alphaxiv.org/?sort=Hot&interval=7+Dayshttps://www.alphaxiv.org/?source=GitHub&interval=7+Days&sort=Hothttps://github.com/trending?since=weekly10 个条目。获取网页中的论文列表、项目列表、论文链接和 arXiv ID 时,按以下顺序尝试:
https://r.jina.ai/example.com 读取页面 Markdown。arXiv ID。arXiv ID。arXiv ID 去重pending 条目,无需启动 subagent。attempt += 1。status = "done",并写入 completedAtstatus = "failed",并写入 error、completedAt直接完成每个条目的内容获取、分析、分类和结果汇总。
如果 source 是 arxiv:
arXiv ID。arXiv ID,构造论文 PDF 链接:
https://arxiv.org/pdf/{arxiv-id}.pdf--range 显式传入用户选择:
python scripts/pdf_to_md.py https://arxiv.org/pdf/{arxiv-id}.pdf tmp_llm_research/{arxiv-id}.md --range introductionpython scripts/pdf_to_md.py https://arxiv.org/pdf/{arxiv-id}.pdf tmp_llm_research/{arxiv-id}.md --range all--range 参数说明:
introduction:仅返回严格匹配 # Introduction 一级标题的 Markdown 内容all:返回整篇论文转换后的完整 Markdown 内容tmp_llm_research/{arxiv-id}.md。references/categories.md 中的大类进行分类。arXiv ID,则不要伪造 ID,也不要直接用网页摘要代替 markdown;应将该任务标记为 failed,并在错误里注明“无法稳定获取 arXiv ID”。如果 source 是 github:
r.jina.ai 版本页面作为兜底。references/categories.md 中的大类进行分类。在当前运行内存中维护成功与失败结果集合,用于最终汇总。结果建议至少包含以下字段:
{
"id": "{序号}",
"title": "{标题}",
"url": "{URL}",
"source": "{arxiv|github}",
"arxivId": "{arXiv ID,如果是 GitHub 则为 null}",
"category": "{类目名称}",
"authors": "{作者或机构,未知可写 Unknown}",
"analysis": "{用简单易懂的语言解释内容,越详细越好}",
"status": "{done或failed,如果是failed需要列上原因}",
"attempt": "{当前尝试次数}",
"completedAt": "{ISO 时间戳}"
}
当所有任务完成后,输出最终 Markdown 报告到 output 文件夹,文件名格式为 YYYYMMDDHHmm.md。
最终报告成功写入后,需要删除整个 tmp_llm_research 文件夹。
最终报告必须包含:
# Report Summary,至少包含:Total、Success、Failed、Retried Success。# Details,必须按 category 聚合,每个分类下的条目至少包含:title、url、source、authors、analysis。# Trending,需要总结本批论文和项目体现出的共同趋势、热门方向和潜在变化。tmp_llm_research,避免影响最终汇总。