Install
openclaw skills install agent-daily-paper支持用户按一个或多个研究领域订阅 arXiv 最新论文,按重要性排序并以中英双语卡片形式推送(英文标题/中文标题/英文摘要/中文摘要/arXiv 链接)。支持每领域独立数量上限(5-20)、关键词高亮、NEW/UPDATED 版本标识、Markdown 存档,以及定时推送与即时推送双路径。首次使用时先完成订阅配置...
openclaw skills install agent-daily-paperpython scripts/bootstrap_env.py --run-doctorpython scripts/sync_arxiv_taxonomy.py --output data/arxiv_taxonomy.jsonpush_time 必须按用户 timezone 的本地时间理解,不能按 UTC 理解。12:00 + Asia/Shanghai -> 0 12 * * * (Asia/Shanghai)08:30 + Asia/Shanghai -> 30 8 * * * (Asia/Shanghai)/home/USER_HOME/.openclaw/workspace/agent-daily-paper 执行:export PATH="/home/USER_HOME/miniconda3/bin:/home/USER_HOME/.nvm/versions/node/NODE_VERSION/bin:/usr/local/bin:/home/USER_HOME/.local/bin:/home/USER_HOME/.bun/bin:/usr/bin:/bin:/home/USER_HOME/.nvm/current/bin:/home/USER_HOME/.npm-global/bin:/home/USER_HOME/bin:/home/USER_HOME/.volta/bin:/home/USER_HOME/.asdf/shims:/home/USER_HOME/.fnm/current/bin:/home/USER_HOME/.local/share/pnpm" && conda run -n arxiv-digest-lab python scripts/run_digest.py --only-due-now --due-window-minutes 15 --emit-markdownUSER_HOME 与 NODE_VERSION 必须替换为当前机器的真实路径delivery.mode: announcedelivery.channel: feishudelivery.to: user:FEISHU_USER_IDcron: 0 12 * * *timezone: Asia/Shanghaireason=already_pushed_today -> 今天该领域已推送过当天该领域无最新论文config/subscriptions.json 中 setup_required=true,必须先向用户收集配置并写入订阅;禁止直接按样例配置执行推送。output/daily/*.mdfield_settings[].name:研究领域名(可多个)field_settings[].limit:每领域推荐数量(5-20)push_time:每日推送时间(HH:MM,本地时间)timezone:时区(默认 Asia/Shanghai)keywords / exclude_keywordstime_window_hoursquery_strategy(推荐 category_keyword_union)require_primary_category(推荐 true)category_expand_mode(off/conservative/balanced/broad)agent-categories-only(仅使用 Agent 提供分类;缺失分类则报错)taxonomy-json(默认 data/arxiv_taxonomy.json,用于分类合法性校验与补全)embedding_filter.model / embedding_filter.threshold / embedding_filter.top_kagent_rerank.model(默认 BAAI/bge-reranker-v2-m3)/ agent_rerank.top_khighlight.title_keywords / highlight.authors / highlight.venuesinsight_mode(默认 pdf,可选 abstract)insight_pdf_max_pages / insight_pdf_timeout_secTRANSLATE_PROVIDER:argos(默认) / openai(需 OPENAI_API_KEY + OPENAI_TRANSLATE_MODEL) / auto / none优先级:
config/agent_field_profiles.json(默认路径,存在即优先)canonical_en(再做分类与检索,避免中文 arXiv 查询;若输入已是英文则直接使用)data/arxiv_taxonomy.json)支持字段画像 JSON 结构:
canonical_encategorieskeywordstitle_keywordsvenuesquery_strategy=category_keyword_union)require_primary_category=true)embedding_filter)agent_rerank)prepare_fields.py 会在每个领域落盘 Top-K 种子语料:
output/seed_corpus/docs/<canonical_en>.md(标题、作者、摘要、链接)output/seed_corpus/embeddings/<canonical_en>.json(标题+摘要 embedding)prepare_fields.py 时加 --seed-force-refresh。每篇论文输出:
NEW / UPDATED(vX->vY) + 高亮标签)命名规则:<领域1>_<领域2>_<YYYY-MM-DD>.md
Field Profiles,每个领域给出:
Canonical EN(英文领域名)Keywords(检索关键词)Venues/Journals(相关会议或期刊)primary_categories:检索与过滤实际使用的主分类categories:扩展参考分类(展示用)data/state.json -> sent_versions_by_subsent_ids/sent_versions 视为弃用字段,不再参与去重python scripts/doctor.pypython scripts/run_digest.py --emit-markdownpython scripts/run_digest.py --config config/subscriptions.json --emit-markdown0 12 * * * (Asia/Shanghai) -> cd <repo> && conda run -n arxiv-digest-lab python scripts/run_digest.py --config config/subscriptions.json --emit-markdown0 12 * * * (Asia/Shanghai) + export PATH="..." && conda run -n arxiv-digest-lab python scripts/run_digest.py --only-due-now --due-window-minutes 15 --emit-markdownpython scripts/run_digest.py --config config/subscriptions.json --only-due-now --due-window-minutes 15 --emit-markdownpython scripts/instant_digest.py --fields "数据库优化器,推荐系统" --limit 20 --time-window-hours 72推荐 Conda 环境:arxiv-digest-lab
conda create -n arxiv-digest-lab python=3.10 -y
conda activate arxiv-digest-lab
pip install argostranslate pypdf
python scripts/install_argos_model.py --from-code zh --to-code en
python scripts/install_argos_model.py --from-code en --to-code zh
pip install sentence-transformers
python scripts/install_embedding_model.py --model BAAI/bge-m3
[待翻译],不中断主流程。当用户单独提交一篇论文要求解读时,Agent 必须优先阅读 PDF 全文(至少覆盖 Abstract / Introduction / Method / Experiments / Conclusion),并使用以下固定提示词框架进行中文结构化输出。
这些规则属于 Agent 行为规范,维护在 SKILL.md 中,不应在 run_digest.py 里硬编码风格替换规则。
推荐提示词(可直接复用):
你是一名科研助手。请仔细阅读以下论文,并对其进行系统、结构化的分析与解读。
请按照以下结构输出:
研究问题(Research Problem)
- 论文试图解决什么问题?
- 为什么这个问题重要?
- 现有方法有哪些局限?
核心思想(Core Idea)
- 论文的核心直觉是什么?
- 作者提出了什么关键思想使方法有效?
方法(Method)
详细解释论文的方法,包括:
- 模型整体架构
- 各个模块的作用
实验设计(Experiments)
总结实验设置,包括:
- 使用的数据集
- 对比方法(Baselines)
- 评价指标
- 实验结果
并解释:
- 为什么该方法效果更好?
- 实验是否充分?
主要贡献(Contributions)
列出论文的主要贡献。
优点(Strengths)
分析该工作的优势,例如:
- 方法创新性
- 实验设计
- 实际应用价值
局限性(Limitations)
指出可能存在的问题,例如:
- 方法假设
- 实验不足
- 可扩展性问题
对研究者的启示(Research Insights)
- 该论文最值得学习的思想是什么?
- 未来可以如何改进或扩展?
11. 通俗解释
用简单易懂的语言解释这篇论文,使研究生能够快速理解核心思想。
请使用清晰的小标题和条理化结构进行中文输出。输出的内容不少于1000字。
输出约束: