Install
openclaw skills install ai-news-digest-cn抓取主流中外 AI 资讯源生成中文 markdown 日报。用户说"生成今日 AI 日报"/"今天有什么 AI 新闻"等指令时启用。
openclaw skills install ai-news-digest-cnYou are generating today's AI industry news digest in Chinese-friendly format.
信源真实性 > 信号广度。宁可漏报,不要错报。
WebSearch 的二手报道可能有 3 类污染:
任何 T+1 信号在写入最终报告前必须通过 Step 6.5 事实核查。无法 verify 的内容 → 标⚠️或剔除,不要为了凑条数硬上。
path=<路径>: 覆盖默认输出位置
mode=<模式>: 同日文件冲突时的行为, 详见 Step 1.6:
mode=update (别名: u / 合并 / merge): 更新累积模式 (A)mode=snapshot (别名: s / 快照): 新建独立副本 (B)mode=skip: 跳过本次, 不抓取自然语言推断 (用户没显式带 mode= 但表达了意图也能识别):
mode=snapshotmode=updatemode=skipregion=<地区>: 网络环境, 决定抓取源清单
region=intl (默认, 别名: international / global / 海外): 抓全部 Tier 1+2+3 源 (原版行为)region=cn (别名: china / 国内 / 大陆): 跳过中国大陆 GFW 阻断的国际源 (Anthropic / OpenAI WebFetch / HuggingFace / Google AI Blog), 只抓 HN + Latent Space + 全部 Tier 2 中文源 + TechCrunch / The Verge / One Useful Thing自然语言推断:
region=cnregion=intl (海外用户 / 已开 VPN 环境)注: WebSearch (Step 5) 走 Anthropic backend, 不受 region 影响, 两个 region 都跑。WebFetch 受目标站本地可访问性影响, region=cn 跳过被墙源。
Default path: ~/Desktop/ai-news/YYYY-MM-DD.md,使用今天的日期 (YYYY-MM-DD 格式)。
如果用户用 path= 指定, 使用用户路径。
如果目标路径已存在文件 → 进入 Step 1.6 同日冲突处理, 不要直接覆盖也不要直接 -second.md。
确保父目录存在 (无论是默认路径还是 path= 自定义路径, 父目录不存在都先创建)。先判断当前 OS 用对应命令:
macOS / Linux / WSL / Git Bash (bash):
mkdir -p "$(dirname <最终目标路径>)"
Windows PowerShell:
New-Item -ItemType Directory -Force -Path (Split-Path -Path "<最终目标路径>" -Parent) | Out-Null
具体例子:
mkdir -p ~/Desktop/ai-news/New-Item -ItemType Directory -Force -Path "$env:USERPROFILE\Desktop\ai-news"path=~/Documents/digests/today.md → mkdir -p ~/Documents/digests/path=$env:USERPROFILE\Documents\digests\today.md → New-Item -ItemType Directory -Force -Path "$env:USERPROFILE\Documents\digests"Windows 默认输出路径用 $env:USERPROFILE\Desktop\ai-news\YYYY-MM-DD.md (PowerShell 也支持 ~ 但 $env:USERPROFILE 更明确稳定)。
获取今天日期 (YYYY-MM-DD 格式):
Unix:
date +%Y-%m-%d
Windows PowerShell:
Get-Date -Format "yyyy-MM-dd"
配置说明:
~/Documents/ai-news/),改完后下面 Step 1.5 / Step 6.7 的路径要同步改path= 参数可临时覆盖默认值(Step 1.2 检测到目标文件已存在时执行本步)
你 (执行本 skill 的 LLM) 需要判断当前 agent runtime 是否能即时收到用户回复:
交互式 runtime (可问用户):
非交互式 runtime (不能问 / 不该问):
mode= 参数 / 等价自然语言意图 → 直接按参数走, 跳过询问 + 跳过 runtime 检测向用户说一段大致如下的话, 然后等用户回答, 不要开始 Step 2 抓取:
检测到今天已经生成过 ~/Desktop/ai-news/YYYY-MM-DD.md (上次 HH:MM 生成)。
要怎么处理?
A · 更新到最新累积版本 (推荐): 旧版自动归档到 .archive/, 新版包含当日全部抓取
B · 新建独立副本: 写到 -second.md, 不影响原文件
C · 跳过本次: 不抓取, 看上次的就行
请回答 A/B/C, 或直接说想要的行为 (例如"更新" / "另存一份" / "别跑")。
A · 更新累积模式 (mode=update):
YYYY-MM-DD.md 移动到归档目录, 文件名带时间戳: ~/Desktop/ai-news/.archive/YYYY-MM-DD-HHMMSS.md (例: 2026-05-24-080012.md)mkdir -p ~/Desktop/ai-news/.archive/ 或对应 Windows 命令)YYYY-MM-DD.md**Updated at HH:MM** · +N new items since previous run (archived: .archive/YYYY-MM-DD-HHMMSS.md)B · 新建独立副本 (mode=snapshot):
YYYY-MM-DD-second.md 是否存在, 不存在用这个; 存在用 YYYY-MM-DD-third.md (依次类推)C · 跳过 (mode=skip):
今日日报已存在 <路径> (上次 HH:MM 生成), 本次未重新生成。如需更新可说"生成今日 AI 日报 mode=update"。读取 baseline 的两个来源:
(a) 过去 3 天的日报: 如果 ~/Desktop/ai-news/ (或自定义默认目录) 下存在过去 3 天的 YYYY-MM-DD.md 命名文件, Read 提取标题列表 (不需要读全文)。
(b) 同日旧版本 (仅当 Step 1.6 走 A 更新累积模式): Step 1.6.4 A.1 把当日旧版本归档到 .archive/YYYY-MM-DD-HHMMSS.md, 额外 Read 这份归档文件提取标题, 一起合并进 baseline。这一步是为了让"更新累积"模式真正做到只列新增, 不重复 8 点版本已收录的条目。
合并 (a) + (b) 得到完整 baseline 标题列表。
Step 6.1 去重时, 把当天候选条目跟 baseline 对比, 标题语义相似度 ≥ 70% 的视为重复, 剔除。
过去 3 天若没有日报文件且当日没有旧版本, 跳过本步, 不影响后续流程。
WebFetch each source。不同源用不同 prompt, 不要套统一模板。按 Step 1.1 解析的 region 跳过被墙源。
Hacker News Front Page · https://news.ycombinator.com/
提取首页 top 30 stories 里 AI 相关的 (Claude/GPT/Gemini/LLM/Agent/RAG/MCP/embedding/foundation model/AGI/Anthropic/OpenAI/DeepSeek/Qwen/HuggingFace/diffusion/tokenizer/fine-tuning/reasoning model 等关键词), 每条返回 标题/URL/分数/comments 数/1 句要点Latent Space · https://www.latent.space/feed (RSS, 主页 WebFetch 抓不到列表)
提取 RSS feed 最新 3 篇文章, 每条返回 标题/URL/发布日期/1 句要点Anthropic News · https://www.anthropic.com/news
提取最新 5 篇 announcement, 每条返回 标题/URL/发布日期/1 句核心要点OpenAI 动态 · ⚠️ openai.com/news/ 直接 WebFetch 会 403 → 两个 region 都改用 WebSearch (在 Step 5 一并跑)。region=cn 不额外跳过 (本来就用 WebSearch)
HuggingFace Blog · https://huggingface.co/blog
提取最新 5 篇 blog post, 每条返回 标题/URL/发布日期/1 句要点WebFetch, 每个中文源单独写 prompt (不要套统一模板)。全部 9 个源国内可访问 + 反爬不严 + 真实编辑团队 (无 SEO 聚合站), 两个 region 都跑。
量子位 · https://www.qbitai.com/
提取首页今天最新的 5-10 条 AI 资讯文章, 每条返回 标题/URL/发布时间/1 句核心要点机器之心 · https://www.jiqizhixin.com/
提取首页今天最新的 5-10 条 AI 资讯, 每条返回 标题/URL/发布时间/1 句核心要点智东西 · https://zhidx.com/
提取首页今天最新的 5-10 条 AI / 自动驾驶 / 机器人 / 大模型相关资讯, 每条返回 标题/URL/发布时间/1 句核心要点雷峰网 AI 频道 · https://www.leiphone.com/category/ai
提取页面今天最新的 5-10 条 AI 资讯 (含学术论文解读 + 行业深度), 每条返回 标题/URL/发布时间/1 句核心要点提取页面上今天最新的 5-10 条 AI / Agent / LLM 相关技术深度文章, 每条返回 标题/URL/发布时间/1 句核心要点36 氪 AI 频道 · https://36kr.com/information/AI/
提取首页今天最新的 5-10 条 AI 类资讯, 每条返回 标题/URL/发布时间/1 句核心要点钛媒体 · https://www.tmtpost.com/
提取首页今天最新的 5-10 条 AI / 大模型 / Edge AI 相关资讯 (含 AGI 专栏 / Edge AI Daily 早报), 每条返回 标题/URL/发布时间/1 句核心要点品玩 · https://www.pingwest.com/
提取首页今天最新的 5-10 条 AI / 科技 / 商业资讯里 AI 相关的, 每条返回 标题/URL/发布时间/1 句核心要点虎嗅前沿科技频道 · https://www.huxiu.com/channel/105.html
提取页面上今天最新的 5-10 条 AI / 大模型 / 科技公司动态相关文章, 每条返回 标题/URL/发布时间/1 句核心要点注: 9 个源全部经实测 (2026-05 验证), WebFetch 能拿到首页列表 + 不需要登录 + 反爬不严, 且都是真实编辑团队 (排除了 AI 工具集 / 极客公园 等 SEO 聚合站或反爬强的源)。
根据 Tier 1/2 抓到的内容判断今天的热点方向, 从下面候选里挑 2 个最相关的抓 (用通用模板)。按 region 过滤可用候选:
| 源 | URL | 何时该选 | Region |
|---|---|---|---|
| Google AI Blog | https://blog.google/technology/ai/ | Tier 1 出现 Google/DeepMind 相关消息时 | intl only (cn 跳过, 被墙) |
| TechCrunch AI | https://techcrunch.com/category/artificial-intelligence/ | 出现融资 / 商业 / 产品发布消息时 | 两个 region |
| The Verge AI | https://www.theverge.com/ai-artificial-intelligence | 出现主流媒体级别热点时 | 两个 region |
| One Useful Thing | https://www.oneusefulthing.org/ | 出现应用层 / 思想 / 评估方法时 | 两个 region |
通用 WebFetch prompt: 提取页面上最新的 5-10 条 AI 相关内容, 每条返回 标题/URL/发布时间/1 句核心要点
保底规则 (完全没明显热点时):
Google AI Blog + TechCrunch AI (覆盖商业模型 + 融资)TechCrunch AI + The Verge AI (Google AI Blog 被墙, 跳过)⚠️ 注意:Reddit 域名(www.reddit.com)被 Claude Code WebFetch 硬屏蔽,不能直接抓。当天若主题涉及开源/本地模型,在 Step 5 加 r/LocalLLaMA top posts 类关键词替代。
基于 T+0 直抓 / T+1 WebSearch 双引擎模式,主体源每个跑一条配套 WebSearch 抓官方主页漏掉的 3 类内容:
按 Tier 1/2 主体跑配套 WebSearch:
| 主体 | 配套 WebSearch 关键词 |
|---|---|
| Anthropic | Anthropic news this week 2026 或 Anthropic announcement latest |
| OpenAI(替代直抓 403) | OpenAI announcement 2026 latest |
| HuggingFace | HuggingFace top releases this week |
| Latent Space(补 RSS 不全) | Latent Space podcast latest 2026 |
| 国产开源动态 | DeepSeek OR Qwen OR 小米 大模型 最新 |
| Reddit 替代 | r/LocalLLaMA top posts new model release |
基于 Tier 1-3 抓到的信号,跑 2-3 个突发关键词:
<某新模型> release / <某收购事件> details保底关键词(完全没明显热点时):
AI news todayClaude OR GPT OR Gemini latest整合 Tier 1-4 抓到的所有内容,做去重 + 链接择优 + 排序 + 筛选:
同一新闻被多个引擎抓到 → 优先用 T+0 直抓的官方原文链接,T+1 WebSearch 仅作交叉验证或备份。
链接优先级:
去重逻辑:
过滤掉:
排序优先级(从高到低):
最终选 10-15 条,分到 3 个 section:
对 Step 6 筛选后的每条候选条目,先做信源评级,再决定是否保留。
| 等级 | 定义 | 处理 |
|---|---|---|
| 🟢 高可信 | T+0 直抓官方源,且原文有清楚表述支持你写的内容 | 直接保留 |
| 🟡 中可信 | T+1 多家媒体交叉报道,内容一致 + 来自白名单域名 | 必须 fetch 一次最权威的来源 verify · 通过则保留 |
| 🔴 低可信 | 单一 T+1 来源 / 营销夸张标题 / 来自黑名单域名 / 数字异常大 / Anthropic 官方 News 没列但二手有 | 默认剔除,fetch verify 后能 verify 的升级为 🟡 |
官方第一手(.com/.cn 主域):
知名媒体(可作交叉验证):
绝对不要使用,即使 WebSearch 返回:
红旗信号(出现就要重新 verify):
对每条候选条目:
1. 评级 → 🟢 / 🟡 / 🔴
2. 🔴 → 直接剔除
3. 🟡 → fetch 一次最权威源(优先官方,其次白名单媒体)
- fetch 内容支持 → 升级为🟢保留 + 用最权威链接
- fetch 不支持 / 链接 404 / 403 → 降为 🔴 剔除 OR 标 ⚠️ "未 verify"
4. 🟢 → 直接保留
最终原则:
- 宁可日报少 5 条都是 🟢/🟡 verified,
- 也不要 19 条里有 6 条 🔴 未 verify(这就是 v3 翻车的具体场景)
Step 9 输出时, 每条新闻的标题末尾必须加一个 emoji 标可信度:
注: 🔴 标记应在 Step 6.5.5 阶段就被剔除, 不应出现在最终日报。
示例:
### [Project Glasswing: An Initial Update](URL) 🟢### [某条多家媒体报道但官方未确认](URL) 🟡### [某条单源爆料](URL) ⚠️这个标注让用户一眼看出哪些是 T+0 verified 的硬信号, 哪些是 T+1 交叉验证的中可信, 读者可按可信度自己分级阅读, 不需要全盘信任每一条。
按 region 不同, 阈值不同:
满足 abort 条件, 写入最简错误报告并退出, 不要继续到 Step 7-9:
# AI 资讯日报 · YYYY-MM-DD (生成失败)
> Tier 1 抓取大量失败 [+ Tier 2 不足],
> 为避免输出劣质日报误导用户, 任务终止。
**失败源**:
- [源名] · 原因:[404 / timeout / robots / GFW 阻断 / 其他]
- ...
**成功源** (本来应该用上但单独不足以支撑):
- [源列表]
**建议**:
- 检查网络 / 各源 URL 是否变化 / 你的 agent runtime fetch 工具能否访问被墙源
- 如果你在中国大陆 + 用非 Claude Code 的 agent (Cursor / Codex 等本地直连 fetch), 试试 `region=cn` 显式切换跳过被墙源
- 稍后重试
写入路径同 Step 1 (~/Desktop/ai-news/YYYY-MM-DD.md 或 path= 指定)。
设计原则: Tier 1 是这个 skill 的事实锚 (国际权威源)。region=intl 的 Tier 1 失守 → 输出全中文日报会误导; region=cn 的 Tier 1 本来就只有 HN/Latent Space 两个, 失守 + 中文不足 → 同样应该 abort 不出劣质日报。
英文源条目 必须做以下处理:
[Original English Title](URL)**[中文译]**: + 中文翻译标题**摘要**:)用中文写,无论原文什么语言**为什么值得关注**:)用中文写中文源条目:
[中文译] 行)读完所有筛选后的条目,识别 3-5 个底层主题。每个主题:
好主题的特征:
好主题示例:
避免的坏主题:
按以下完整格式写入文件:
# AI 资讯日报 · YYYY-MM-DD
> 生成时间:YYYY-MM-DD HH:MM
> 资讯源:HN / Anthropic / OpenAI / Latent Space / HuggingFace / 量子位 / 机器之心 / 36 氪 + 轮换 [X] / [Y]
> 共 N 条精选
---
## 一、今日要闻 (5-8 条)
### [Original English Title](URL) 🟢
**[中文译]**:中文翻译标题(英文源必填)
**来源**:Anthropic News
**摘要**:1-2 句中文摘要
**为什么值得关注**:1 句中文(可选)
### [中文原标题](URL) 🟢
**来源**:量子位
**摘要**:1-2 句中文摘要(中文源不需要 [中文译] 行)
**为什么值得关注**:1 句中文(可选)
---
## 二、技术热点 (3-5 条)
[同上格式]
---
## 三、行业动态 (3-5 条)
[同上格式]
---
## 四、今日趋势总结
- **主题 1 · [简短主题词]**:一句话中文归纳跨条目的模式
- **主题 2 · [简短主题词]**:同上
- **主题 3 · [简短主题词]**:同上
---
**今日值得深读 (可选)**:
- [文章标题](URL) —— 一句话中文推荐理由
---
**抓取失败记录**(如有):
- [源名] · 原因:[404 / timeout / robots]
---
*Generated by ai-news-digest skill · Tier 1+2 必查 · Tier 3 选用了 [X] / [Y]*
写完文件后,打印一句中文确认:
AI 资讯日报已生成: <完整路径>
共 N 条资讯 · M 个趋势主题
英文条目 X 条(已翻译) · 中文条目 Y 条
Tier 3 选用了:<两个源名>
[中文译] 标题 + 中文摘要(用户主要诉求)生成今日 AI 日报
今天有什么 AI 新闻
用 ai-news-digest 跑一下今天的资讯
ai-news-digest path=/path/to/custom.md
生成今日 AI 日报 path=~/Documents/digests/today.md
生成今日 AI 日报 mode=update # 更新累积 (覆盖旧版 + 归档)
生成今日 AI 日报 mode=snapshot # 新建副本 -second.md
生成今日 AI 日报 mode=skip # 跳过本次, 看上次的就行
生成今日 AI 日报 region=cn # 跳过 Anthropic/HuggingFace/Google 等被墙源, 靠 HN+Latent Space+9 个中文源
生成今日 AI 日报 region=intl # 默认, 全 Tier 1+2+3 跑
生成今日 AI 日报, 不要覆盖之前的 # = mode=snapshot
今天 AI 新闻, 合并到现有日报里 # = mode=update
ai-news-digest, 看看上次的就行 # = mode=skip
生成今日 AI 日报, 我没开 VPN # = region=cn
今天的 AI 新闻, 国内网络 # = region=cn
非交互式 runtime 调用本 skill 时, 同日重跑会自动走 mode=update (Step 1.6 默认 A)。如果想要别的行为, 必须在 trigger 里显式带 mode= 参数:
# cron 每天早晚各跑一次, 用 update 模式累积
@daily echo "生成今日 AI 日报 mode=update" | claude-code
Claude 基于 description 自动识别意图 + 解析参数 + 调用本 skill。