arxiv-weekly-report

v1.0.0

根据 arXiv 学科分类和关键词检索最近一周论文,提炼主要创新点,并生成周报。

0· 132·0 current·0 all-time

Install

OpenClaw Prompt Flow

Install with OpenClaw

Best for remote or guided setup. Copy the exact prompt, then paste it into OpenClaw for shu-ang/arxiv-weekly-report.

Previewing Install & Setup.
Prompt PreviewInstall & Setup
Install the skill "arxiv-weekly-report" (shu-ang/arxiv-weekly-report) from ClawHub.
Skill page: https://clawhub.ai/shu-ang/arxiv-weekly-report
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

Command Line

CLI Commands

Use the direct CLI path if you want to install manually and keep every step visible.

OpenClaw CLI

Bare skill slug

openclaw skills install arxiv-weekly-report

ClawHub CLI

Package manager switcher

npx clawhub@latest install arxiv-weekly-report
Security Scan
VirusTotalVirusTotal
Pending
View report →
OpenClawOpenClaw
Benign
high confidence
Purpose & Capability
技能名、描述、SKILL.md 与两份 Python 脚本(检索 arXiv API、下载并提取 PDF 文本)相互一致。所需能力仅为网络访问与在用户主目录下写入缓存/报告文件,这与“生成 arXiv 周报”的目的相符。
Instruction Scope
SKILL.md 明确要求调用本技能目录下的脚本、在 ~/.openclaw/skills/arxiv-weekly-report 下读写缓存与报告,并在必要时创建虚拟环境并安装 pypdf。总体在预期范围内,但需注意 fetch_arxiv_pdf_text.py 支持传入任意 --pdf-url,因此如果错误或恶意地传入非 arXiv 链接,脚本会下载任意 URL 指向的 PDF——这属于使用时的输入风险而非技能自身隐藏行为。
Install Mechanism
没有自动安装步骤(instruction-only + 包含脚本)。唯一运行时依赖是 pypdf(通过 pip 安装),以及系统 Python。没有从可疑 URL 下载或执行未审查的二进制。
Credentials
技能没有请求任何环境变量、凭据或外部服务密钥。所需权限仅限网络访问和在其自身目录及报告目录写入文件,这与功能需求相称。
Persistence & Privilege
技能未设置 always:true,亦不修改其他技能或系统配置。它在用户主目录下创建缓存与报告文件,但作用域限制在 ~/.openclaw/skills/arxiv-weekly-report/*,权限需求合理。
Assessment
这项技能总体自洽且与其描述一致,但在安装/使用前请注意: - 脚本需要 Python 与 pypdf(pip install pypdf);建议在虚拟环境中安装以避免污染全局环境。 - 技能会从 arXiv 的 API 与 PDF 链接下载内容并把报告写入 ~/.openclaw/skills/arxiv-weekly-report/report,请确认接受在该路径写入文件并留有足够磁盘空间。 - fetch_arxiv_pdf_text.py 支持传入任意 --pdf-url,因此不要向脚本传入不可信的 URL(避免从未知域下载文件)。 - 若担心自动化调用或网络访问风险,可在受控环境(隔离容器或受限网络)中运行,或在平台上禁用技能的自动调用权限再人工触发。 - 如需更高信心,可人工审阅 scripts/*.py 源码并在首次运行时监控网络/文件行为。

Like a lobster shell, security has layers — review code before you run it.

latestvk978249p2b67hq0k7a6ay2cd1h83b482
132downloads
0stars
1versions
Updated 1mo ago
v1.0.0
MIT-0

arXiv 论文周报技能

当用户提出以下类型的需求时,使用本技能:

  • 按学科领域和关键词搜索 arXiv 论文
  • 查看最近一周某个方向的新论文
  • 生成 arXiv 论文周报
  • 总结最近论文的主要创新点
  • 做文献追踪、论文速览、研究趋势观察

本技能的目标是:

  1. 根据用户给出的学科领域和关键词,在 arXiv 中检索最近一周上传或更新的相关论文;
  2. 挑选最相关的一批论文;
  3. 分析每篇论文的研究问题、方法思路、主要创新点、意义与可能局限;
  4. 生成一份结构化中文周报;
  5. 将最终周报保存到指定目录,便于后续归档和复用。

一、输入理解规则

从用户请求中尽量提取以下信息:

  • 学科领域 / arXiv 分类代码
  • 关键词
  • 时间范围(默认最近 7 天)
  • 论文数量上限(默认 10 篇,最多建议 20 篇)
  • 输出语言(默认中文)
  • 是否需要“重点推荐论文”
  • 是否需要“趋势总结”

如果用户给的是自然语言领域名称,请映射为常见 arXiv 分类代码:

  • 自然语言处理 / NLP -> cs.CL
  • 计算机视觉 / CV -> cs.CV
  • 机器学习 / Machine Learning -> cs.LG
  • 人工智能 / AI -> cs.AI
  • 机器人 / Robotics -> cs.RO
  • 语音 / Audio / Speech -> eess.AS
  • 强化学习 -> 常优先考虑 cs.LG,必要时兼顾 cs.AI
  • 多模态 -> 常优先考虑 cs.CVcs.CLcs.LG,根据用户表达选择最贴近的一类

如果用户没有明确提供分类代码,但领域名称足够清晰,则直接做合理映射,不必反复追问。

如果用户未明确说明时间范围,则默认检索最近 7 天。

如果用户未明确说明论文数量,则默认纳入分析 5 到 10 篇最相关论文。

二、执行方式

优先使用 Python 脚本:

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py

该脚本负责:

  • 按分类与关键词检索 arXiv
  • 拉取最近一周论文
  • 返回结构化 JSON

调用时使用如下形式:

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py --category <分类代码> --keywords "<关键词1>,<关键词2>,..." --days 7 --max-results 20

说明:

  • --category 为 arXiv 分类代码,例如 cs.LG
  • --keywords 为逗号分隔的关键词列表
  • --days 默认为 7
  • --max-results 是从 arXiv 拉取的候选论文上限,建议 10~30

如果用户给出多个关键词,应尽量全部传入脚本。

如果脚本返回候选论文较多,应优先挑选最相关的前 5~10 篇用于周报分析。

如果有能力执行文件写入操作,则在生成最终周报后必须写入指定目录中的 Markdown 文件。

三、论文筛选规则

脚本返回结果后,按以下原则筛选用于周报的论文:

  1. 必须在给定时间窗口内(默认最近 7 天)
  2. 优先保留与关键词高度相关的论文
  3. 优先保留标题与摘要都明显相关的论文
  4. 避免重复主题占比过高,尽量保留主题多样性
  5. 如果结果很多,优先选最值得阅读的 5~10 篇

如果相关论文数量很少,可以如实说明“本周匹配论文较少”。

如果没有找到合适论文,应明确告诉用户没有检索到足够相关的论文,不要编造结果。

四、每篇论文的分析要求

对每篇选中的论文,基于标题、摘要、分类和链接,提炼以下内容:

  • 论文标题

  • 作者

  • 提交/更新时间

  • arXiv 链接

  • 研究问题:论文要解决什么问题

  • 方法思路:核心方法是什么

  • 主要创新点:相对已有工作新在哪里

  • 价值与意义:为什么值得关注

  • 可能局限:基于摘要能看出的适用边界或潜在不足

  • 论文评分:5分制,从以下几个维度考虑

    评价指标分值
    创新性1
    方法有效性1
    实验完整性1
    实用价值1
    行文逻辑1

要求:

  • 保持谨慎,不要虚构论文中未出现的实验细节
  • 如果只是从摘要推断出的内容,要避免说得过于绝对
  • 尽量用简洁、专业、适合科研汇报的语言
  • 如果信息不足,要明确写出“仅基于摘要判断”

五、全文获取规则

当出现以下情况时,必须考虑调用本技能目录下的全文提取脚本:

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py

适用场景:

  1. 仅凭摘要无法准确判断论文的主要创新点;
  2. 摘要对方法细节描述过少,无法完成高质量分析;
  3. 论文明显很有价值,值得进一步阅读全文;
  4. 需要确认实验设置、方法结构、贡献点表述或局限分析时;
  5. 需要对重点推荐论文做更深入解读时。

调用方式示例:

注意:

需要在workspace创建虚拟环境并激活,并执行pip install pypdf

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --id <arxiv_id> --max-pages 12 --save-text

或:

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --pdf-url <pdf链接> --max-pages 12 --save-text

执行要求:

  • 默认先提取前 8 到 12 页;
  • 如果前几页仍不足以支持分析,可适当增加页数;
  • 不要默认对所有论文都抓取全文,避免不必要的开销;
  • 优先对重点论文或摘要不充分的论文使用全文提取;
  • 使用全文后,应基于全文内容补充或修正对创新点、方法思路和局限性的判断;
  • 如果全文提取失败,应明确说明失败原因,并退回基于摘要进行谨慎总结。

如果脚本成功提取全文,可优先使用以下信息进行深度分析:

  • 摘要
  • 引言
  • 方法部分
  • 实验部分
  • 结论部分

六、周报输出格式

默认输出为中文 Markdown 周报,并且除了在对话中给出摘要外,还必须将完整周报保存为 .md 文件到以下目录:

~/.openclaw/skills/arxiv-weekly-report/report

周报结构如下:

<主题> arXiv 最近一周论文周报

1. 本周概览

  • 检索领域:
  • 检索关键词:
  • 时间范围:
  • 命中论文数:
  • 最终纳入分析数:

2. 本周重点结论

用 3~6 条总结本周最值得关注的趋势、方法变化或新动向。

3. 重点论文解读

对每篇论文按如下格式输出:

论文 1:<标题>

  • 作者:
  • 时间:
  • 分类:
  • 链接:
  • 研究问题:
  • 方法思路:
  • 主要创新点:
  • 价值与意义:
  • 可能局限:

论文 2:<标题>

  • 作者:
  • 时间:
  • 分类:
  • 链接:
  • 研究问题:
  • 方法思路:
  • 主要创新点:
  • 价值与意义:
  • 可能局限:

依此类推。

4. 本周趋势观察

从所有入选论文中提炼:

  • 高频主题
  • 常见方法路线
  • 新出现的研究方向
  • 值得持续跟踪的问题

5. 建议重点跟踪论文

给出 3~5 篇最值得继续阅读的论文,并说明推荐原因。

6. 附录(可选)

如果需要,可附上未纳入重点解读但值得关注的论文列表。

七、输出风格要求

  • 默认使用中文
  • 语言简洁、准确、偏学术报告风格
  • 不要使用夸张宣传语
  • 不要把摘要原文大段照搬
  • 重点突出“创新点”和“为什么值得关注”
  • 如果信息不足,要明确说明“仅基于摘要判断”
  • 如果论文很多,优先总结共性趋势,再展开重点论文

八、结果落盘要求

生成周报后,必须将最终周报保存到以下目录:

~/.openclaw/skills/arxiv-weekly-report/report

保存格式要求:

  • 文件格式必须为 Markdown
  • 文件后缀必须为 .md
  • 如果目录不存在,应先创建目录再写入文件
  • 文件名应包含主题和日期,便于后续归档和检索

推荐文件名格式:

arxiv_weekly_report_<category>_<YYYY-MM-DD>.md

例如:

  • arxiv_weekly_report_cs.LG_2026-03-18.md
  • arxiv_weekly_report_cs.CL_2026-03-18.md

在完成周报内容生成后,必须:

  1. 确保目录 ~/.openclaw/skills/arxiv-weekly-report/report 存在;
  2. 将最终周报写入该目录下的 .md 文件;
  3. 在回复用户时,说明周报已保存,并给出保存路径;
  4. 如写入失败,应明确说明失败原因,不要假装已经成功保存。

如果同时需要在对话中展示内容,则可以先给出摘要版,再说明完整版本已保存到指定路径。

九、异常处理

如果脚本执行失败、无网络、arXiv 无结果、分类不合法、返回数据为空或文件写入失败,应:

  1. 直接说明问题;
  2. 尝试给出可能原因;
  3. 如有必要,建议用户修改分类代码或关键词;
  4. 不要编造论文结果;
  5. 不要假装周报已经保存成功。

如果脚本返回空结果,但用户需求合理,可以建议:

  • 放宽关键词
  • 改为相邻领域分类
  • 延长时间窗口,例如最近 14 天

十、额外说明

如果用户明确要求:

  • “只看最近 3 天”,则修改 days
  • “多给一点论文”,可适当提高纳入分析数量
  • “英文输出”,则将周报改为英文
  • “只给简版”,则保留概览 + 重点结论 + 推荐论文即可
  • “给出完整周报文件”,则优先确保 Markdown 文件写入成功并返回保存路径

如果用户未特别说明,默认:

  • 中文输出
  • 最近 7 天
  • 8 到 12 篇重点论文
  • 输出完整周报并保存到 report 目录

十一、最终行为要求

完成任务时,必须尽量遵循以下顺序:

  1. 理解用户输入中的领域、关键词、时间范围与输出要求;
  2. 调用 fetch_arxiv_weekly.py 获取候选论文;
  3. 进行相关性筛选与内容分析,对于重点推荐论文需要做更深入解读,调用fetch_arxiv_pdf_text.py获取全文;
  4. 生成结构化中文周报;
  5. 将完整周报写入 ~/.openclaw/skills/arxiv-weekly-report/report 目录下的 .md 文件;
  6. 在回复中告知用户周报已生成,并给出保存路径;
  7. 如果任一步骤失败,应明确说明失败位置和原因。

Comments

Loading comments...