抖音爆款爬虫

Other

爬取抖音爆款视频和文案数据。支持自然语言搜索(如"搜索一下海鲜视频")和结构化 CLI 调用,使用 Playwright 自动化浏览器,无浏览器时自动降级为模拟数据。

Install

openclaw skills install douyin-scraper-cn

抖音爆款爬虫 Skill

功能

  • 🔍 自然语言搜索 — 直接用中文搜索,如"搜索一下海鲜视频"
  • 📊 热榜获取 — "看看抖音热榜"、"美食热榜"
  • 📝 文案提取 — 提取视频标题、描述、标签
  • 🎬 数据导出 — JSON / CSV

快速使用(自然语言)

# 搜索视频
python scripts/nl_search.py "搜索一下海鲜视频"

# 热榜
python scripts/nl_search.py "看看抖音热榜有什么"

# 指定输出
python scripts/nl_search.py "找一些海鲜售卖相关的视频文案" -o result.json

自然语言格式

Agent 收到自然语言请求时,调用 nl_search.py 即可:

用户说命令
搜索一下海鲜视频python scripts/nl_search.py "搜索一下海鲜视频"
看看抖音热榜python scripts/nl_search.py "看看抖音热榜"
找5条小龙虾视频python scripts/nl_search.py "找5条小龙虾视频"
美食热榜python scripts/nl_search.py "美食热榜"

结构化 CLI

# Python
python scripts/scraper.py search --keyword "海鲜" --limit 10
python scripts/scraper.py hot --category "美食" --limit 20

# Node.js
node scripts/douyin_scraper.js search "海鲜" 10
node scripts/douyin_scraper.js hot "美食" 20

输出格式

JSON

[
  {
    "title": "视频标题",
    "description": "视频描述",
    "author": "作者昵称",
    "play_count": 1000000,
    "like_count": 50000,
    "comment_count": 2000,
    "share_count": 1000,
    "url": "https://www.douyin.com/video/xxx",
    "tags": ["标签1", "标签2"],
    "publish_time": "2026-06-08"
  }
]

安装(可选 — 有浏览器时获取真实数据)

pip install playwright
playwright install chromium

未安装 Playwright 浏览器时自动降级为模拟数据,不会报错。

注意事项

  • 仅供学习研究使用
  • 遵守抖音平台规则,避免频繁请求
  • 不要登录账号,避免风控