zion-xhs-catch-skill

Other

小红书笔记采集工具。当用户需要从小红书按关键词搜索并批量采集笔记数据时,使用此 skill。 触发关键词:采集小红书、抓小红书、小红书搜索、小红书笔记、小红书数据、小红书竞品、小红书调研、小红书内容、小红书痛点、小红书用户反馈。 功能:基于 Kimi WebBridge 控制用户真实浏览器,采集笔记标题、正文、作者、点赞/收藏/评论数、图片 URL、一级评论。

Install

openclaw skills install zion-xhs-catch-skill

小红书采集 Skill

按关键词搜索小红书笔记,批量采集结构化数据。

前置检查

  1. WebBridge 状态

    ~/.kimi-webbridge/bin/kimi-webbridge status
    

    必须 running: trueextension_connected: true

  2. 浏览器已登录小红书

  3. 项目依赖

    cd /Users/mao/vibe/zion-xhs-catch-skill && npm install
    

执行采集

cd /Users/mao/vibe/zion-xhs-catch-skill

# 基础用法
npx ts-node webbridge-crawl.ts --keyword="关键词" --limit=20

# 不采评论
npx ts-node webbridge-crawl.ts --keyword="关键词" --limit=20 --no-comments

# 限制评论数
npx ts-node webbridge-crawl.ts --keyword="关键词" --limit=20 --max-comments=10
参数说明默认
--keyword搜索关键词(必填)-
--limit采集数量上限,建议 ≤2020
--no-comments不采集评论区默认采集
--max-comments每篇最多评论数20

输出

  • output/关键词_YYYYMMDD.md — Markdown 格式采集结果
  • output/index.html — 可视化报告(可选)

数据结构

interface XHSNote {
  xhs_note_id: string;
  title: string;
  content: string;
  author_name: string;
  images: string[];
  likes: number;
  collects: number;
  comments_count: number;
  comments: { author: string; content: string; likes: number }[];
  comments_extracted: number;
  keyword: string;
  source_url: string;
  crawl_time: string;
}

故障处理

  • WebBridge 未运行~/.kimi-webbridge/bin/kimi-webbridge start
  • 数据为空:检查浏览器登录状态,或减少 limit
  • 弹窗未弹出:笔记未加载完,增大 limit 让预加载更充分