Install
openclaw skills install data-ai-daily-briefAI-powered industry intelligence daily brief generator for the Data+AI sector. Automatically searches, filters, writes, and delivers structured daily briefin...
openclaw skills install data-ai-daily-brief一个 AI 驱动的行业情报日报生成技能,自动搜集、过滤、编写并推送高质量的行业日报。默认以 Data+AI 行业为例,可通过配置文件切换至任何行业。
当用户请求生成日报时,按以下步骤执行:
config.json 配置文件(如果存在)scripts/init_config.py 初始化默认配置使用 web_search 工具,按以下优先级和过滤规则采集信息:
数据平台优先,严格过滤。 每条信息必须能明确回答:这会影响企业数据平台的产品路线、架构设计、成本结构、治理方式、运维效率或 Agent 在数据场景的落地吗?如果不能明确回答「是」,一律不纳入。
信息宁缺毋滥。 绝不因为某个板块条目过少而降低准入标准。日报的价值在于精准,不在于条数多。
阶段一:一手来源定向搜索(必须执行)
针对第一优先级厂商,逐一搜索其官方渠道:
英文搜索:
site:databricks.com OR site:snowflake.com OR site:aws.amazon.com announcementsite:cloud.google.com OR site:azure.microsoft.com data platform announcementsite:github.com (apache/iceberg OR apache/spark OR apache/flink OR trinodb/trino) releasesite:prnewswire.com OR site:businesswire.com data platform OR data lake OR data warehousesite:prnewswire.com OR site:businesswire.com (funding OR acquisition OR IPO) data platform中文搜索:
site:cloud.tencent.com OR site:help.aliyun.com 数据 发布site:volcengine.com OR site:huaweicloud.com 数据 公告site:caict.ac.cn OR site:ccidreport.com OR site:cesi.cn 数据 发布 报告(辅助,这些站点索引差,不能作为覆盖国内机构的唯一手段)信通院 OR 中国信息通信研究院 数据 报告 发布赛迪研究院 OR CCID 数据 报告国家数据局 数据 政策 OR 规划 OR 标准投融资定向搜索(必须执行):
(Databricks OR Snowflake OR Confluent OR ClickHouse OR dbt) funding OR acquisition OR IPOdata platform OR data infrastructure funding round数据平台 OR 大数据 融资 OR 收购 OR 上市(Databricks OR Snowflake OR Palantir OR Elastic OR Cloudera) earnings OR revenue OR quarterly resultssite:news.crunchbase.com OR site:techcrunch.com "venture capital" OR "funding" datasite:cbinsights.com data OR analytics report阶段二:扩展搜索(补充覆盖)
英文:
"data platform" OR "data infrastructure" release announcement {date_range}Databricks OR Snowflake OR "data lakehouse" announcement {date_range}Apache Iceberg OR Hudi OR Paimon OR "Delta Lake" release {date_range}"data governance" OR "data catalog" OR "data quality" announcement {date_range}Gartner OR Forrester OR IDC "data platform" OR "data analytics" {date_range}ClickHouse OR DuckDB OR StarRocks OR Doris release update {date_range}中文:
数据平台 OR 数据基础设施 发布 公告湖仓一体 OR 数据湖 OR 数据治理 新品阿里云 OR 腾讯云 OR 华为云 数据 发布艾瑞咨询 OR 亿欧智库 数据平台 OR 大数据 报告国家数据局 OR 数据要素 政策 OR 标准 OR 规划"data platform" OR "data infrastructure" partnership OR integration OR collaboration {date_range}阶段三:来源溯源(强制执行)
对阶段二中通过媒体报道发现的信息,必须使用 web_fetch 或追加 site: 搜索追溯到一手来源。无法找到一手来源的信息标注「⚠️ 待验证」或降级到 Watchlist。
搜索覆盖硬性要求:必须对所有第一优先级厂商至少执行一次定向搜索。
工作日(周二至周五) 严格只覆盖过去 24 小时内(日报日期前一天 08:00 至当天 08:00 CST)首次公开发布的信息。
周一特殊规则: 时效性窗口扩展为 72 小时(上周五 08:00 CST 至周一 08:00 CST),覆盖周五至周日三天。周一日报总量上限从 10-14 条放宽至 14-20 条。周一日报标题标注为《Data+AI 全球日报 | YYYY-MM-DD(含周末)》。
⚠️ 时效性红线——以下情况一律不得纳入:
✅ 时效性判定方法:
大数据、数据平台、数据基础设施、数据治理、数据工程、数据智能平台、湖仓架构、查询引擎、流批处理、向量检索基础设施、开源数据生态。
AI 相关信息仅在明确影响数据平台时才纳入。
第一优先级: AWS、Google Cloud、Microsoft Azure、Databricks、Snowflake、阿里云、腾讯云、华为云、字节跳动火山引擎
第二优先级: Confluent、MongoDB、Elastic、ClickHouse、Cloudera、Starburst/Trino、dbt Labs、Fivetran、Airbyte、Dataiku、Palantir、百度智能云、京东云
仅在与数据平台直接相关时: NVIDIA、Intel、AMD
Iceberg、Hudi、Paimon、Delta Lake、Trino、Spark、Flink、Ray、Airflow、Kafka、dbt、ClickHouse、DuckDB、Milvus、Weaviate、Lance/LanceDB、StarRocks、Doris、SeaTunnel、Amoro 等。
重点跟踪厂商: Databricks、Snowflake、Google Cloud、AWS、阿里云大数据、Elastic、Cloudera、华为云大数据、Palantir
信息源: SiliconANGLE Big Data、DBTA (Database Trends and Applications)、InfoQ 大数据、PR Newswire、Business Wire、SEC EDGAR(美股财报)、各公司 IR 页面、Crunchbase News、CB Insights、PitchBook News、TechCrunch Venture
全球头部: Gartner、Forrester、IDC、a16z、Sequoia、Bessemer、Futurum Group、Constellation Research、Wikibon/SiliconANGLE Research
国内研究机构: 信通院、赛迪研究院、电子标准院、艾瑞咨询、亿欧智库
政策与标准机构: 国家数据局、工信部(数据相关政策)
头部券商研报: 国内外头部券商中与数据平台直接相关的核心论点和数据
仅接受一手来源: 官网、官方博客、release notes、GitHub 仓库、原始发言(X/LinkedIn/博客)、earnings call 原始记录、分析师机构报告、PR Newswire/Business Wire 新闻稿
不接受: 财经媒体二手分析(分析师报告除外)
基于已筛选出的有效信息,生成一份面向数据平台从业者的专业日报。
Level A:已确认事实 — 有公司官网、官方博客、GitHub release、财报文件、活动实录等一手来源确认。→ 可进入 A / B / C / D。
Level B:高可信二手确认 — 有 Reuters、Bloomberg、TechCrunch 等可靠媒体报道,但暂无一手文件。→ 可谨慎进入 A / C,但必须标注「媒体报道/未见公司正式文件」。未正式确认事件优先放 E。
Level C:间接信号 / 未证实传闻 — 社交媒体爆料、社区讨论、未合并 PR 猜测。→ 只能进 E. Watchlist。
同一条信息只能归入一个主板块,优先级:A > B > C > D > E。若已作为 A 板块核心事件,不再在 B/C/D 重复展开。
去重自检(强制步骤): 完成全部板块编写后,列出所有事件/来源/产品名称,检查跨板块重复。同一事件出现在两个以上板块 → 保留优先级最高的板块,其余删除或仅用一句引用(≤15字)。
标题格式:# Data+AI 全球日报 | YYYY-MM-DD(周一标注「含周末」)
开头固定结构:
**今日最重要的3点:**
1. [一句趋势判断,写方向而非完整事件,15-30 字]
2. [一句趋势判断,写方向而非完整事件,15-30 字]
3. [一句趋势判断,写方向而非完整事件,15-30 字]
**总判断:** [用 1-2 句话给出当天最值得带走的行业判断,≤120字,必须落到数据平台演进方向、投入重点或市场变化]
重要区分:「今日最重要的3点」不是 Top Signals 的摘要版,也不是 3 条事件标题。它是跨事件提炼出的 3 个「今天该带走的变化方向」。
硬约束:
总判断约束:
自检方法: 写完3点后,遮住 A 板块,只看3点。如果读者能从3点中直接还原出 A 板块每条的标题和核心数字,说明3点写得太像摘要了,需要重写。
A. Top Signals(3条)
当天最重要的已发生事件,必须有一手来源。每条包含:
### 1. 事件标题
**来源:** [具体出处](链接)
**摘要:** 2-3 句
**为什么对数据平台重要:** xxx
> 企微摘要:xxx
B. Product & Tech(0-6条,宁缺毋滥)
严格限定为数据平台相关的产品与技术动态。
每条包含:事件标题、来源、摘要(1-2句)、对数据平台的影响判断、企微摘要
C. Views & Research(0-5条)
收录两类高价值信息:关键人物的原始观点,以及高公信力机构的正式研究。
每条包含:人物/机构名称、来源、核心观点、映射到数据平台的判断、企微摘要
D. Capital & Corporate(0-4条,宁缺毋滥)
收录与数据平台领域直接相关的资本与公司事件,使用 inline 类型标签:
每条包含:
### 1. 【投融资】事件标题
**来源:** [具体出处](链接)
**核心数据:** 融资金额/估值/营收/增长率
**摘要:** 2-3 句
**对数据平台的影响:** xxx
> 企微摘要:xxx
E. Watchlist(1-3条)
收录三类信息:
每条包含:关注项标题、来源、为什么值得继续看、需要等待什么信号确认、企微摘要
每条新闻在所有详细字段之后,必须附加一行:> 企微摘要:一句话语义压缩
规则:
重要性排序与渠道差异化:
搜索范围的扩展可能带来更多候选信息。必须严格按重要性排序,不能因为来源多了就降低门槛:
Data+AI全球日报_{date}.md
> 企微摘要:xxx 行assets/report-template.html 模板样式,生成美观的 Data+AI全球日报_{date}.html
生成文件后、推送前,必须执行一轮完整 review。review 不通过不得进入 Step 6 推送。
Review 检查项:
根据 config.json 中的配置,执行推送。支持以下 9 大渠道(✅ 已验证 / 📦 社区贡献·未验证):
✅ 企业微信:scripts/send_wecom.py
WECOM_WEBHOOK_URL📦 钉钉:scripts/send_dingtalk.py
DINGTALK_WEBHOOK_URL,可选加签 → DINGTALK_SECRET📦 飞书:scripts/send_feishu.py
FEISHU_WEBHOOK_URL,可选签名 → FEISHU_SECRET--card --link-url <URL>📦 Slack:scripts/send_slack.py
SLACK_WEBHOOK_URL📦 Discord:scripts/send_discord.py
DISCORD_WEBHOOK_URL📦 Telegram:scripts/send_telegram.py
TELEGRAM_BOT_TOKEN,Chat ID → TELEGRAM_CHAT_ID📦 Microsoft Teams:scripts/send_teams.py
TEAMS_WEBHOOK_URL--legacy📦 邮件:scripts/send_email.py
SMTP_HOST, SMTP_USER, SMTP_PASSWORD, EMAIL_TO✅ GitHub Pages:scripts/deploy_github.py
GITHUB_TOKEN, GITHUB_USER以下规则不可违反,优先级高于所有其他指引:
| 场景 | 处理方式 |
|---|---|
| 搜索阶段全部无结果 | 报告「今日无符合条件的信息」,生成空日报模板(仅标题+日期),不推送 |
| 单一来源不可用(如某网站超时) | 跳过该来源,继续其他搜索,在报告中标注「⚠️ {来源} 未能访问」 |
| 候选信息全部未通过 Review | 输出审查结果明细,不推送,等用户决策 |
| 推送失败(webhook 超时/403) | 重试 1 次,仍失败则保存文件到工作区并通知用户手动推送 |
| 配置文件缺失 | 使用 scripts/init_config.py 生成默认配置后继续 |
| HTML 模板缺失 | 仅生成 Markdown 文件,跳过 HTML 生成,在输出中说明 |
编辑 config.json 中的 customization 字段,可自定义:
在 config.json 的 adapters 中启用渠道并填入配置:
| 渠道 | 配置键 | 类型 | 主要环境变量 |
|---|---|---|---|
| 企业微信 | wechatwork | Webhook | WECOM_WEBHOOK_URL |
| 钉钉 | dingtalk | Webhook | DINGTALK_WEBHOOK_URL, DINGTALK_SECRET |
| 飞书 | feishu | Webhook | FEISHU_WEBHOOK_URL, FEISHU_SECRET |
| Slack | slack | Webhook | SLACK_WEBHOOK_URL |
| Discord | discord | Webhook | DISCORD_WEBHOOK_URL |
| Telegram | telegram | Bot API | TELEGRAM_BOT_TOKEN, TELEGRAM_CHAT_ID |
| Teams | teams | Webhook | TEAMS_WEBHOOK_URL |
| 邮件 | email | SMTP | SMTP_HOST, SMTP_USER, SMTP_PASSWORD |
| GitHub | github | API | GITHUB_TOKEN, GITHUB_USER |
修改 config.json 中的 cron 配置:
{
"schedule": "0 8 * * 1-5",
"timezone": "Asia/Shanghai"
}