news-scraper-xiaobai
v1.0.0从AI新闻网站爬取最新资讯,支持新闻分类和标签,用于内容聚合和舆情监控。
⭐ 0· 115·0 current·0 all-time
byBAI@jiahuishao
MIT-0
Download zip
LicenseMIT-0 · Free to use, modify, and redistribute. No attribution required.
Security Scan
OpenClaw
Benign
high confidencePurpose & Capability
技能名/描述为爬取 AI 新闻站点并聚合内容;仓内包含爬虫类、主脚本和配置,所需依赖(requests、BeautifulSoup)与功能一致。没有要求与目的不符的凭证或二进制。
Instruction Scope
SKILL.md 指令直接运行 scripts/crawl.py 或通过 crawl_and_return_json 编程调用,指令与代码行为一致(抓取页面、解析、保存)。注意文档中有小不一致:说明输出 JSON 在 ~/Documents/News,但代码默认使用当前工作目录下的 News 目录;SKILL.md 要求模型生成摘要,但代码本身不调用任何外部 AI 服务(期待由 agent / 使用者 来生成)。
Install Mechanism
无安装规范(instruction-only),但包内包含 requirements.txt。没有来自不可信 URL 的下载或可疑安装步骤;依赖均为常见 Python 库。
Credentials
不要求任何环境变量或凭证(primary credential: none)。代码仅发起到公开网站的 HTTP 请求,不访问系统凭证或外部私有服务。
Persistence & Privilege
技能不会请求常驻(always)权限,也不修改其他技能配置。但会在磁盘上创建/更新文件(默认在当前工作目录的 News 子目录,固定文件名 news_latest.json),可能覆盖已有文件;请在合适的工作目录下运行并避免以高权限用户执行。
Assessment
这是一个本地新闻爬虫:它只访问公开的 AIBase 网站并把结果保存到磁盘,不需要 API 密钥或其它敏感凭证。注意事项:
- 运行前在预期的目录执行(或显式传入 news_dir),以避免覆盖不相关的文件。脚本默认写入 ./News/news_latest.json(SKILL.md 文档中提到的 ~/Documents/News 与代码默认不一致)。
- 安装前查看 requirements.txt 并在隔离的虚拟环境中安装依赖(requests、beautifulsoup4)。
- 如果你计划让代理自动调用此技能,确认你信任它在本地写文件并在网络上抓取公开页面;技能不会向第三方上报抓取结果,但模型/代理可能会在后续步骤使用或发送这些数据,所以注意模型如何处理返回的 JSON(摘要生成流程)。
- 若打算扩展到其他网站或增加自动摘要,请先审查新增爬虫代码,注意避免爬取需要身份认证或私有内容。Like a lobster shell, security has layers — review code before you run it.
latestvk9771bzcfar4rye58k19msrb35832myx
License
MIT-0
Free to use, modify, and redistribute. No attribution required.
