Xiaohongshu Data
v1.1.0科特船长 - 小红书数据抓取,笔记数据/博主分析/热搜词监控
Security Scan
OpenClaw
Benign
medium confidencePurpose & Capability
技能声称抓取小红书公开数据,所需的唯一环境变量是 XIAOHONGSHU_COOKIE,这与要提高抓取成功率的目的相符。没有要求与功能不相关的云凭据或额外工具。
Instruction Scope
SKILL.md 指导用户通过浏览器获取并设置 XIAOHONGSHU_COOKIE(这是抓取网页数据常见做法)并包含 CLI 用法。需要注意的是,随附的 fetcher.py 当前处于“演示模式”,仅使用模拟数据并没有读取环境变量或执行实际网络抓取——这与文档宣称的“抓取真实数据(需配置 Cookie)”在实现上并不一致(即实现未包含真实抓取逻辑)。文档也提醒不要泄露 Cookie。
Install Mechanism
无 install 规范,代码为 instruction-only + 附带示例脚本。没有通过下载可疑二进制或远程脚本进行安装,风险较低。
Credentials
仅请求一个环境变量 XIAOHONGSHU_COOKIE,数量上是成比例的。但 Cookie 是高敏感凭据(可用于代表用户访问平台),用户应理解这授予的访问权限并谨慎提供;技能本身虽声明只抓取公开数据,但 Cookie 可能被滥用(风险来源于凭据泄露,而非当前代码)。
Persistence & Privilege
没有请求永久驻留(always: false),也不修改其他技能或系统配置。默认允许模型调用(平台默认),与技能类型一致。
Assessment
要点说明:
- Cookie 是敏感凭据:不要把你的主要账号 Cookie 透露给不信任的技能或第三方;如果提供,务必使用临时/次要账号并在测试后立即更换/撤销 Cookie。
- 技能当前为演示实现:fetcher.py 使用模拟数据并未执行真实抓取或读取环境变量;如果你期望真实抓取,请向作者索取完整实现或审阅实际网络请求代码后再使用。
- 合规与封号风险:自动化抓取可能违反平台条款并导致被封,确保抓取频率与用途符合平台政策与法律要求。
- 审查来源与网络行为:在运行任何会使用你 Cookie 的脚本前,先审阅代码是否包含外部上传/隐藏终端点、未授权的远程请求或日志写出到外部位置。
- 建议:在隔离环境或使用次级账号测试,必要时要求作者提供开源实现或详细说明真实抓取逻辑。Like a lobster shell, security has layers — review code before you run it.
Runtime requirements
📕 Clawdis
EnvXIAOHONGSHU_COOKIE
Primary envXIAOHONGSHU_COOKIE
latest
小红书数据抓取 - 科特船长版
⚠️ 重要说明
本技能仅抓取小红书公开数据,遵守平台规则:
- 不抓取用户隐私信息
- 不高频请求(间隔 3-5 秒)
- 仅用于个人学习/研究/商业分析
- 不得用于违法用途
功能说明
帮助用户抓取小红书公开数据,包括:
- 笔记数据(点赞、收藏、评论数)
- 博主信息(粉丝数、笔记数)
- 热搜词监控
- 竞品笔记分析
使用方法
前置准备
-
获取 Cookie(可选,用于提高抓取成功率)
- 打开小红书网页版 (xiaohongshu.com)
- 登录账号
- F12 打开开发者工具
- 复制 Cookie 值
-
设置环境变量
export XIAOHONGSHU_COOKIE="your_cookie_here"
基础用法
# 抓取博主笔记数据
clawhub run ke-xiaohongshu-data --action profile --url "https://www.xiaohongshu.com/user/profile/xxx"
# 抓取单篇笔记数据
clawhub run ke-xiaohongshu-data --action note --url "https://www.xiaohongshu.com/explore/xxx"
# 搜索关键词笔记
clawhub run ke-xiaohongshu-data --action search --keyword "护肤" --limit 50
# 监控热搜词
clawhub run ke-xiaohongshu-data --action trending --category "美妆"
参数说明
| 参数 | 必填 | 说明 | 默认值 |
|---|---|---|---|
--action | 是 | 操作类型:profile/note/search/trending | - |
--url | 条件必填 | 博主主页或笔记 URL | - |
--keyword | 条件必填 | 搜索关键词 | - |
--limit | 否 | 抓取数量上限 | 20 |
--output | 否 | 输出文件路径 | ./xiaohongshu-data.xlsx |
--cookie | 否 | Cookie 值(或用环境变量) | - |
--delay | 否 | 请求间隔(秒) | 3 |
输出数据格式
博主数据 (profile)
| 字段 | 说明 |
|---|---|
| 博主 ID | 小红书用户 ID |
| 昵称 | 博主昵称 |
| 粉丝数 | 粉丝数量 |
| 关注数 | 关注数量 |
| 获赞数 | 总获赞数 |
| 笔记数 | 笔记总数 |
| 简介 | 个人简介 |
笔记数据 (note)
| 字段 | 说明 |
|---|---|
| 笔记 ID | 笔记唯一 ID |
| 标题 | 笔记标题 |
| 内容 | 笔记正文 |
| 点赞数 | 点赞数量 |
| 收藏数 | 收藏数量 |
| 评论数 | 评论数量 |
| 发布时间 | 发布时间 |
商业化应用
品牌方
- 寻找合适的 KOL/KOC 合作
- 监控竞品投放效果
- 分析热门内容趋势
MCN 机构
- 评估达人价值
- 监控达人数据
- 内容策略分析
个人博主
- 学习爆款笔记
- 分析竞品内容
- 优化自身运营
定价建议
| 版本 | 功能 | 价格 |
|---|---|---|
| 免费版 | 每日 10 次查询,基础数据 | 免费 |
| 专业版 | 无限查询,导出数据,监控预警 | ¥29.9/月 |
| 企业版 | API 接入,定制报表,多账号 | ¥299/月 |
定制服务
需要定制数据抓取服务?
- 电商竞品监控:¥500-2000/项目
- 月度数据报告:¥1000/月
- 私有化部署:¥5000+
联系:私信获取报价
注意事项
- 合法合规: 仅抓取公开数据,不侵犯隐私
- 频率控制: 避免高频请求,防止被封
- Cookie 安全: 不要泄露 Cookie,定期更换
- 数据使用: 仅用于分析学习,不得商用转售
常见问题
Q: 抓取失败怎么办? A: 检查 Cookie 是否过期,尝试更新 Cookie;或降低抓取频率。
Q: 会被封号吗? A: 正常使用不会,但请遵守平台规则,不要高频抓取。
Q: 能抓取评论详情吗? A: 目前仅抓取评论数量,评论详情需要额外开发。
作者: 科特船长 更多技能: https://clawhub.ai/@xiaoheizp
Comments
Loading comments...
