news-scraper-xiaobai

v1.0.0

从AI新闻网站爬取最新资讯,支持新闻分类和标签,用于内容聚合和舆情监控。

0· 195·0 current·0 all-time

Install

OpenClaw Prompt Flow

Install with OpenClaw

Best for remote or guided setup. Copy the exact prompt, then paste it into OpenClaw for jiahuishao/news-scraper-xiaobai.

Previewing Install & Setup.
Prompt PreviewInstall & Setup
Install the skill "news-scraper-xiaobai" (jiahuishao/news-scraper-xiaobai) from ClawHub.
Skill page: https://clawhub.ai/jiahuishao/news-scraper-xiaobai
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

Command Line

CLI Commands

Use the direct CLI path if you want to install manually and keep every step visible.

OpenClaw CLI

Bare skill slug

openclaw skills install news-scraper-xiaobai

ClawHub CLI

Package manager switcher

npx clawhub@latest install news-scraper-xiaobai
Security Scan
VirusTotalVirusTotal
Benign
View report →
OpenClawOpenClaw
Benign
high confidence
Purpose & Capability
技能名/描述为爬取 AI 新闻站点并聚合内容;仓内包含爬虫类、主脚本和配置,所需依赖(requests、BeautifulSoup)与功能一致。没有要求与目的不符的凭证或二进制。
Instruction Scope
SKILL.md 指令直接运行 scripts/crawl.py 或通过 crawl_and_return_json 编程调用,指令与代码行为一致(抓取页面、解析、保存)。注意文档中有小不一致:说明输出 JSON 在 ~/Documents/News,但代码默认使用当前工作目录下的 News 目录;SKILL.md 要求模型生成摘要,但代码本身不调用任何外部 AI 服务(期待由 agent / 使用者 来生成)。
Install Mechanism
无安装规范(instruction-only),但包内包含 requirements.txt。没有来自不可信 URL 的下载或可疑安装步骤;依赖均为常见 Python 库。
Credentials
不要求任何环境变量或凭证(primary credential: none)。代码仅发起到公开网站的 HTTP 请求,不访问系统凭证或外部私有服务。
Persistence & Privilege
技能不会请求常驻(always)权限,也不修改其他技能配置。但会在磁盘上创建/更新文件(默认在当前工作目录的 News 子目录,固定文件名 news_latest.json),可能覆盖已有文件;请在合适的工作目录下运行并避免以高权限用户执行。
Assessment
这是一个本地新闻爬虫:它只访问公开的 AIBase 网站并把结果保存到磁盘,不需要 API 密钥或其它敏感凭证。注意事项: - 运行前在预期的目录执行(或显式传入 news_dir),以避免覆盖不相关的文件。脚本默认写入 ./News/news_latest.json(SKILL.md 文档中提到的 ~/Documents/News 与代码默认不一致)。 - 安装前查看 requirements.txt 并在隔离的虚拟环境中安装依赖(requests、beautifulsoup4)。 - 如果你计划让代理自动调用此技能,确认你信任它在本地写文件并在网络上抓取公开页面;技能不会向第三方上报抓取结果,但模型/代理可能会在后续步骤使用或发送这些数据,所以注意模型如何处理返回的 JSON(摘要生成流程)。 - 若打算扩展到其他网站或增加自动摘要,请先审查新增爬虫代码,注意避免爬取需要身份认证或私有内容。

Like a lobster shell, security has layers — review code before you run it.

latestvk9771bzcfar4rye58k19msrb35832myx
195downloads
0stars
1versions
Updated 1mo ago
v1.0.0
MIT-0

新闻爬取 Skill

快速开始

python scripts/crawl.py --site aibase --limit 20

编程调用

import sys
sys.path.insert(0, "news-scraper")
from scripts.crawl import crawl_and_return_json

result = crawl_and_return_json(site="aibase", limit=20)
# AI自行处理返回数据
# 原文链接使用中文路径: https://www.aibase.com/zh/news/xxxxx

分类与标签

每条新闻需要添加分类和标签,便于后续筛选和整理。

分类

分类说明
大模型基础模型、LLM、多模态等
AI应用产品、工具、平台
企业商业公司动态、财报,合作
安全合规安全漏洞、政策法规
开源社区开源项目,社区动态
硬件芯片GPU、AI芯片、硬件
学术研究论文、突破
智能体Agent技术

标签

标签说明
OpenAIOpenAI相关
Google谷歌相关
NVIDIA英伟达相关
MetaMeta相关
Microsoft微软相关
阿里巴巴阿里相关
中国国内动态
国际国外动态
Agent智能体
多模态多模态技术
安全安全相关

使用方式

在总结输出中添加分类和标签。

总结输出格式

AI在总结新闻时,使用以下markdown格式:

📅 2026-03-17 AI资讯

---

🧠 **智能体**

> 📌 标题:英伟达发布 NemoClaw
> 🏷️ 分类:智能体 | 标签:NVIDIA、Agent
> 📝 概要:英伟达发布企业级AI智能体平台NemoClaw,为OpenClaw提供企业级安全盔甲
> 🔗 链接:https://www.aibase.com/zh/news/26291

> 📌 标题:钉钉发布"悟空"AI原生平台
> 🏷️ 分类:智能体 | 标签:阿里巴巴、Agent
> 📝 概要:阿里B端AI Agent战略落地,支持PC与移动端双端运行
> 🔗 链接:https://www.aibase.com/zh/news/26285

---

🔒 **安全合规**

> 📌 标题:国安部发布OpenClaw安全养殖手册
> 🏷️ 分类:安全合规 | 标签:中国、安全、Agent
> 📝 概要:提醒用户警惕主机接管、数据窃取、言论篡改四大安全风险
> 🔗 链接:https://www.aibase.com/zh/news/26298

Comments

Loading comments...