Install
openclaw skills install llm-daily-digest生成一份当日 LLM / 大模型领域的中文资讯简报。采集来源包括:**8 家头部厂商官方博客**(海外:OpenAI / Anthropic / Google DeepMind / Meta AI / xAI / Mistral;国内:DeepSeek / 通义千问 Qwen —— 最高优先级一手源)、GitHub Trending、arXiv(cs.CL / cs.AI / cs.LG / cs.CV)、Hugging Face、Papers With Code、Hacker News、X/Twitter、以及机器之心、量子位等中文媒体;覆盖四类内容:厂商官方发布、新开源项目、新论文、行业资讯/事件。只要用户说"跑一下今天的 AI 日报""生成大模型日报""今日大模型简报""总结一下今天 AI 动态""给我一份 LLM 快报""今天 AI 圈发生了啥""AI 圈今天有啥""看看今天大模型那边啥情况",或被 cron 定时任务触发(触发消息中包含"日报""digest""brief"等关键字),都应使用此 skill。即使用户没说"日报"两个字,但表达出"整理今天 LLM 相关的项目/论文/新闻"意图的也应触发(例如"今天 HuggingFace 上有啥好东西""今天有什么 AI 新论文值得看""OpenAI / Anthropic / DeepSeek / Qwen 今天有啥新动态")。产出是一份结构化 Markdown 文件,标题为 `🗣️ 今天 AI 圈发生了啥 · YYYY-MM-DD`,保存到 `~/.openclaw/workspace/digests/YYYY-MM-DD.md`,并在会话里附上文件路径和本日最值得看的 3 条精选。
openclaw skills install llm-daily-digest这个 skill 让 OpenClaw agent 每天自动采集、筛选、汇总 LLM / 大模型领域的关键动态,产出一份中文 Markdown 简报。设计目标是"一份能让我在地铁上 5 分钟读完、又不漏掉当天真正重要的事"的日报。
按顺序执行以下步骤(其中步骤 2 的多个来源可以并行抓取,browser 工具支持多标签):
确定时间窗:默认采集过去 24 小时的内容。如果用户说"这周""最近三天"则相应调整。把当前日期保存为 TODAY(格式 YYYY-MM-DD,时区 UTC+8 / 北京时间)。
并行采集各来源:按"来源清单"章节逐一抓取。遇到不可达的源(403、超时、Cloudflare 拦截等)记录一下但跳过,不要中断整个流程——宁可日报缺一个来源,也不要因为一个源挂掉就没日报。
去重 & 筛选:同一个项目/论文可能在多个源出现(比如 arXiv 一篇爆款论文同时上了 HN 和机器之心)。合并成一条,保留最权威的原始链接,但在备注里注明"也被 X / Y 报道"。筛选标准见下方"筛选与质量标准"。
归类 & 重要度打分:把所有条目归入 6 个分类(见"输出结构"),并为每条打一个内部重要度(高/中/低),用来决定要不要进"🔥 今日要闻"。
写简报:严格按"输出结构"章节的 Markdown 模板输出,中文撰写。每条 1-2 句话点到即止,不要复述原文——这是简报不是翻译。
保存文件:写到 ~/.openclaw/workspace/digests/<TODAY>.md。如果当日文件已存在,追加 -v2、-v3 后缀,不要覆盖。
回消息:在当前 session 里回复用户三件事——
下面每个来源都标注了 URL、抓取方式、关注什么、跳过什么。优先用 OpenClaw 的 browser 工具抓取渲染后的页面;静态 HTML 的源可以直接 fetch。
这是一手源——头部厂商发布任何东西,简报都应该第一时间捕获。其他来源(HN、机器之心等)通常是这些官方发布的二次传播。每天必查,哪怕没新东西也要确认一下是"今天确实没动静"而不是"漏了"。
分为海外头部(6 家)和国内头部(2 家)两组。全部都是 Tier-1,每天都要轮询一遍。
subsidiary(DeepMind / Google AI 二选一,同一家公司但品牌和定位不同)。vendor(OpenAI / Anthropic / Google / Meta / xAI / Mistral / DeepSeek / Qwen)、title、published_date、type(product / research / policy / safety / company)、one_line_cn、link。?since=daily 下的 All / Python / TypeScript / Jupyter Notebook 四种,避免只看一种语言漏掉东西。llm、gpt、agent、rag、multimodal、vlm、mllm、diffusion、transformer、fine-tun、inference、quantization、mcp、prompt、embedding、vector、finetune、distill、chat、claude、anthropic、openai、gemini、deepseek、qwen、llama、mistral、huggingface、ollama、vllm、sglang。repo (owner/name)、stars_today、stars_total、language、one_line_cn(一句中文概括)、link。cs.CL(自然语言)、cs.AI、cs.LG(机器学习)、cs.CV(计算机视觉,用于捕捉多模态相关)。[new] 而非 [replaced])。title、authors_short(前 3 位 + 机构)、one_line_cn(中文摘要 1-2 句)、arxiv_link、categories。-GGUF、-AWQ、-gptq 但原模型已经在榜的);优先收录带 model card 说明的首发模型。model/paper/dataset name、publisher、downloads_or_likes、one_line_cn、link。title、task、one_line_cn、pwc_link、code_link。title、points、comments、one_line_cn(用帖子和评论区精华归纳出"为什么大家在讨论")、hn_link、source_link(原链接)。site:nitter.net 或从 google 搜索 site:x.com @username)。@OpenAI、@AnthropicAI、@GoogleDeepMind、@Meta_AI、@deepseek_ai、@Alibaba_Qwen、@huggingface、@karpathy、@sama、@miramurati、@demishassabis、@jeremyphoward、@hardmaru、@_akhaliq、@rohanpaul_ai、@_philschmid。title、author、publish_time、one_line_cn(摘核心观点,不抄原文)、link。采到的原始条目通常会有 100+,最终进入简报的应该 25-40 条(不含"要闻"重复)。把握以下几点:
厂商官方发布优先:上述 8 家头部厂商官博的任何新帖都直接进"🏢 厂商官方发布"对应的子分区;如果是新模型 / 新产品 / 新 API 类,还要进"🔥 今日要闻"头部。这些官博是最权威的一手源,哪怕只有一句发布公告也要收。
优先原始源:如果机器之心/量子位在转载 OpenAI 的发布,简报里链 OpenAI 官方博客原文,加备注"机器之心有中文报道"。
去重要狠:DeepSeek 发新模型,arXiv / HF / PwC / 机器之心 / HN / X 可能都在说。合并成一条。厂商官博发布和其他源的报道也要合并——原链接给厂商官博,正文提一句"HN 讨论 / 机器之心报道"。
时效:严格按 24 小时内;如果某条 48 小时前发布但今天才开始发酵(HN 热帖),可以收录并标注。
反营销:发布会预告、未发布的 demo 视频、纯观点稿,除非出自 OpenAI / Anthropic / Google / Meta / DeepSeek 这种重量级主体,否则不收。
反水稿:国内一些媒体会把同一个资讯改几个标题反复发,遇到相同主题的多篇稿件只保留信息量最大那篇。
工程 vs 研究平衡:尽量让 GitHub 新项目(工程向)和 arXiv 论文(研究向)都有一定比例,不要全是论文或全是工具。
重要度打分:
今日要闻跨源去重(重要!):一个事件常在多个来源同时出现——例如 Claude 新版发布可能同时被 Anthropic 官博、HN、arXiv、机器之心、量子位、X 多方报道。在"🔥 今日要闻"里,同一事件最多占 1 个槽位(链到最权威的一手源,正文一句话提"另有 X、Y、Z 报道"即可)。避免要闻 5 条里有 3 条都在讲同一件事的尴尬。判断"同一事件"以核心主体 + 核心动作为准("Anthropic 发布 Opus 4.7" vs "Opus 4.7 在 SWE-bench 上刷新 SOTA" 算同一事件;"OpenAI 发 Agents SDK" vs "OpenAI 融资 $122B" 不算)。
用这个模板输出 Markdown,严格遵守 heading 结构(方便后续做聚合 / RSS / 检索)。中文撰写,emoji 保留,链接用 Markdown 语法。
空分区处理规则(重要):
判断标准:读者翻到这节能否得到比标题多的信息?能——保留;不能——省略。
# 🗣️ 今天 AI 圈发生了啥 · YYYY-MM-DD
> 数据窗口:YYYY-MM-DD HH:MM ~ YYYY-MM-DD HH:MM (UTC+8)
> 本期采集 N 个源 / M 条原始条目 / K 条入选
---
## 🔥 今日要闻
1. **<标题>** — 一到两句话说清"发生了什么"和"为什么重要"。[原始链接](url)
2. ...
3. ...
(3-5 条,超过 5 条说明没筛够狠,回去再砍。)
---
## 🏢 厂商官方发布
### 🌐 海外头部
#### OpenAI
- [**<标题>**](url) · YYYY-MM-DD · `product` / `research` / `policy` — 一到两句话说清核心内容。
- ...(若今日无则写 "> 今日无新发布。")
#### Anthropic
- [**<标题>**](url) · YYYY-MM-DD · `product` / `research` — 一到两句话。
#### Google DeepMind / Google AI
- [**<标题>**](url) · YYYY-MM-DD · `DeepMind` / `Google AI` · `product` / `research` — 一到两句话。
#### Meta AI
- [**<标题>**](url) · YYYY-MM-DD · `Llama` / `FAIR` / `product` — 一到两句话。
#### xAI
- [**<标题>**](url) · YYYY-MM-DD · `Grok` / `API` / `company` — 一到两句话。
#### Mistral AI
- [**<标题>**](url) · YYYY-MM-DD · `model` / `product` — 一到两句话。
### 🇨🇳 国内头部
#### DeepSeek
- [**<标题>**](url) · YYYY-MM-DD · `model` / `tech-report` / `pricing` — 一到两句话。
#### 通义千问 Qwen
- [**<标题>**](url) · YYYY-MM-DD · `model` / `product` / `framework` — 一到两句话。
(这一节**每天都要有**,8 家都要列出。没内容的厂商写 "> 今日无新发布。" 保留结构,用来证明"确实查过了"而不是"漏了"。)
---
## 📦 GitHub 新项目 / 趋势
- [`owner/repo`](url) · ⭐ +today / total · `Python` — 一句话中文概括。
- ...
(按今日新增 star 数降序。)
---
## 📄 arXiv 新论文
- **<论文中文标题或英文原标题>** · `cs.CL` · 作者 et al. (机构) — 一到两句话摘要。[arXiv](url)
- ...
(5-10 篇,按相关度和重要度排序。)
---
## 🤗 Hugging Face
### 新模型
- [<model-id>](url) · 发布方 · ⬇️ N / ❤️ M — 一句话说明。
### Daily Papers 精选
- ...
---
## 📊 Papers With Code
- **<标题>** · 任务:`task-name` — 一句话。[论文](url) · [代码](url)
- ...
(跟 arXiv / HF 已覆盖的论文不重复。)
---
## 💬 社区热议
### Hacker News
- **<标题>** · ▲ points / 💬 comments — 为什么大家在讨论。[HN](hn-url) · [原链接](src-url)
### X / Twitter
- **@username**:引用或概括这条推文的核心信息。[链接](url)
- ...
**(传言/爆料必须单独隔离,放在 X 分区末尾)**:
- ⚠️ **未证实传言** · **@username**:内容概括——**需明确标注"未经官方证实"**。[链接](url)
传言判定标准:任何"内部人士爆料""预训练完成""x 天后发布""定价是 Y"等没有厂商官方博客同步印证的推文,都必须加 ⚠️ 前缀并放在传言小节。**宁可漏也不要让未证实信息混在正常条目里**——读者可能当成事实去决策,日报的可信度就崩了。
(如果 X 今日未采集,这个子章节写 "> 本期未采集到 X 内容。")
---
## 🇨🇳 中文媒体精选
- [**<标题>**](url) · 机器之心 — 核心观点一两句。
- [**<标题>**](url) · 量子位 — 核心观点一两句。
- ...
(每家 2-5 条,去除与前面章节重复的。)
---
## 📝 编者按
用 2-3 句话点出今日主题或趋势。例如"今天 DeepSeek 和 Qwen 都在推理优化上有新动作,开源社区对小模型 RL post-training 的热度持续上升"。**只有当确实有可总结的趋势时才写**,没有就省略这一节。
---
*本日报由 OpenClaw + llm-daily-digest skill 自动生成 · 仅供个人信息聚合使用,内容版权归原作者*
~/.openclaw/workspace/digests/YYYY-MM-DD.md-v2、-v3 不覆盖。mkdir -p。~/.openclaw/workspace/digests/INDEX.md,追加一行到开头 - YYYY-MM-DD: [链接到今日文件] — 今日要闻第 1 条标题 作为导航。这个 skill 本身只是"怎么做"的说明,"每天自动跑"这件事要在 OpenClaw 侧单独配置 cron job。具体配置语法请以 OpenClaw 官方文档为准:
核心思路就是定一个调度,让它定时给 agent 发一条消息(比如 "跑一下今天的大模型日报"),agent 在读取该消息时会匹配到本 skill 的 description 从而触发执行。
关键配置点:
0 9 * * *;注意 OpenClaw 的 cron 运行时区是否为系统本地时间或 UTC,需要相应换算)。避开 UTC 0:00 前后——国内媒体还没更新当日内容,arXiv 也刚换日期。跑一下今天的大模型日报 或 使用 llm-daily-digest skill 生成今日简报,两者都能命中本 skill 的 description。main session 即可(参见 OpenClaw 的 session 模型文档)。配置完成后,可以先手动触发一次(直接给 agent 发测试消息)验证跑通,再让 cron 每日自动执行。
用户发起:
跑一下今天的大模型日报
Agent 行为(简要):
~/.openclaw/workspace/digests/2026-04-17.md✅ 2026-04-17 日报已生成:
~/.openclaw/workspace/digests/2026-04-17.md今日 3 条精选:
- Anthropic 发布 Claude Opus 4.7 — 推理与代码能力提升,Claude 4.7 family 首款旗舰([链接])
- Qwen3.6-35B-A3B 开源 — 阿里巴巴 Qwen 团队发布最新混合专家模型([链接])
- HuggingFace Trending:某 Agent 框架 24h +1.2k stars — ...([链接])
本期采集 14 个入口 / 原始 142 条 / 入选 35 条。
以下是可按需扩展的方向:
设计重点:可靠跑通 · 中文输出质量 · 易于人工审阅