抖音作品爬取

API key required
Other

抖音作品爬取工具,输入抖音名称或抖音ID,输出抖音账号基础信息和近期作品内容列表(最多50条)。当用户提到"爬取抖音作品"、"抖音作品列表"、"查看抖音视频"、"抖音内容采集"、"抓取抖音作品"时使用。

Install

openclaw skills install douyin-works-crawler

抖音作品爬取

输入抖音名称或ID,一键获取账号基础信息 + 近期作品内容


简介

抖音作品爬取是一款专为抖音内容分析打造的智能工具,帮助用户快速获取任意抖音账号的基础信息和近期作品数据。

通过简单的账号名称或抖音号输入,你可以:

  • 📊 获取账号基础信息(粉丝数、获赞、作品总数、红狐指数等)
  • 📋 查看近期作品列表(最多50条,含互动数据和作品链接)
  • 🔍 发现互动TOP3作品,获取值得学习的内容分析
  • 📥 未收录账号支持一键提交收录,30分钟后自动同步

适用于品牌方、MCN机构、内容运营、自媒体从业者等需要分析抖音账号表现的场景。


功能特性

🎯 核心功能

  • 📊 账号信息查询:输入抖音昵称或抖音号,一键获取账号基础数据(粉丝数、获赞、作品总数、红狐指数等)
  • 📋 近期作品爬取:自动获取近期作品列表(最多50条),包含点赞、评论、分享、互动数及作品链接
  • 🔍 数据亮点分析:互动量TOP3作品分析 + 账号特征分析(更新频率、互动表现、爆款特征)

✨ 特色亮点

  • ⚡ 智能识别:自动判断输入类型(昵称/抖音号),无需手动切换查询模式
  • 📥 账号收录:未收录账号支持一键提交收录,30分钟后自动同步数据
  • 🔗 直达链接:昵称跳转账号主页,作品列表跳转视频页面
  • 🔒 安全可靠:API 接入方式,无需登录抖音账号

一键安装

前置条件

  • Python 3.6+
  • 红狐数据API密钥(格式 ak_xxx

安装方式

方式一:直接使用(推荐)

  1. 确保项目文件已下载到本地
  2. 配置环境变量:
    # macOS/Linux
    export REDFOX_API_KEY=你的API密钥值
    
    # Windows PowerShell
    $env:REDFOX_API_KEY="你的API密钥值"
    
  3. 运行查询:
    python scripts/douyin_works_fetcher.py --account "抖音名称或抖音号"
    

方式二:在 Coze/Dify 等平台配置

  1. 将技能文件夹上传至平台
  2. 在环境变量中配置 REDFOX_API_KEY
  3. 配置触发词,即可通过对话调用

环境变量配置

变量名必填说明
REDFOX_API_KEY红狐数据API密钥(格式 ak_xxx

使用指南

基础使用

1. 查询账号作品

告诉助手你想查询的抖音账号:

用户:爬取"周幺姑家常菜"的抖音作品

助手:已为您查询到「周幺姑家常菜」的账号数据,粉丝547.1w,近期47条作品...

2. 精准查询(推荐)

使用抖音号进行精准查询,避免昵称模糊匹配:

用户:帮我查询抖音号 cdjjc028 的作品

助手:已精准匹配到「周幺姑家常菜」的账号数据...

3. 账号收录

当账号未被收录时,回复抖音号即可提交收录:

用户:帮我查询"xxx"的作品

助手:未查询到当前账号的相关信息,可提交当前抖音账号进行账号收录。1. 回复抖音号...2. 下次再说;

用户:1212_1234

助手:已提交账号收录请求,系统正在同步数据,约30分钟后可再次查询。

高级使用

4. 导出JSON格式

需要结构化数据时,可指定JSON输出:

python scripts/douyin_works_fetcher.py --account "抖音号" --output json

5. 命令行直接提交收录

python scripts/douyin_works_fetcher.py --account "任意" --sync "抖音号"

命令速查

命令功能
爬取抖音作品 [名称/抖音号]查询账号作品数据
抖音作品列表 [名称/抖音号]获取近期作品列表
抖音内容采集 [名称/抖音号]采集账号内容
导出抖音作品 [名称/抖音号]导出作品数据
回复抖音号提交账号收录(未命中时)

使用场景

场景一:品牌方竞品监测

角色:品牌营销经理

需求:监测竞品抖音账号的内容表现和互动数据

使用方式

  1. 输入竞品账号的抖音号进行查询
  2. 查看近期作品列表和互动数据
  3. 分析互动TOP3作品的内容特征

预期收益:及时掌握竞品内容动态,优化自身内容策略


场景二:MCN 机构达人评估

角色:MCN 运营人员

需求:评估达人账号的数据表现和内容方向

使用方式

  1. 查询目标达人的账号基础信息(粉丝数、获赞、红狐指数)
  2. 分析近期作品的互动表现
  3. 查看账号特征分析,了解更新频率和内容方向

预期收益:快速评估达人价值,辅助签约决策


场景三:自媒体内容优化

角色:抖音内容创作者

需求:学习同领域头部账号的爆款内容特征

使用方式

  1. 查询同领域头部账号的作品数据
  2. 查看互动TOP3作品的分析
  3. 学习爆款内容值得借鉴的点

预期收益:找到内容优化方向,提升账号互动表现


场景四:数据分析报告

角色:数据分析师

需求:批量获取抖音账号的结构化数据用于分析

使用方式

  1. 使用 --output json 参数导出结构化数据
  2. 批量查询多个账号
  3. 结合其他数据进行综合分析

预期收益:高效获取数据,支撑分析报告输出


项目架构

目录结构

douyin-works-crawler/
├── scripts/
│   └── douyin_works_fetcher.py   # 核心脚本(API调用+数据格式化)
├── references/
│   └── core_workflow.md          # 核心技能逻辑(接口规范、输出模板、处理规则)
├── CONFIG.json                   # 技能配置文件
└── SKILL.md                      # 技能说明文档

技术栈

项目说明
运行环境Python 3.6+
数据来源红狐数据API
认证方式API Key(X-API-KEY请求头)
输出格式Markdown / JSON

核心模块说明

  • DouyinWorksFetcher:核心类,封装查询和收录两大功能
    • query_account():查询账号信息和作品列表
    • sync_account():提交账号收录请求
    • format_markdown() / format_json():输出格式化

📌 完整的接口规范、输出模板、处理规则等核心逻辑详见 references/core_workflow.md,Agent 执行时必须遵循该文件中的所有规则。


常见问答

安装相关问题

Q1: 运行时提示"未设置环境变量 REDFOX_API_KEY"怎么办?

A: 请先配置环境变量:

# macOS/Linux
export REDFOX_API_KEY=你的API密钥值

# Windows PowerShell
$env:REDFOX_API_KEY="你的API密钥值"

Q2: 红狐数据API密钥如何获取?

A: 前往红狐平台注册并申请API密钥,格式为 ak_xxx


使用相关问题

Q3: 用昵称查询返回的不是我要找的账号怎么办?

A: 抖音昵称不唯一,建议使用抖音号进行精准查询。抖音号在抖音APP → 目标账号主页 → 昵称下方查看。

Q4: 为什么有些账号查不到?

A: 可能该账号尚未被红狐平台收录。查询未命中时会提示账号收录,回复抖音号即可提交收录,约30分钟后可再次查询。

Q5: 作品列表最多显示多少条?

A: 近期作品数据最多50条,按发布时间倒序排列。awemeCount 字段为账号历史作品总数,作品列表中的数量可能小于该值。


故障排除

Q6: API调用报错"积分不足"怎么办?

A: 红狐API按调用次数计费,请前往红狐平台充值积分。

Q7: 查询超时怎么办?

A: 请检查网络连接是否正常,脚本默认超时时间为30秒。如持续超时,可稍后重试。


版本信息

  • 当前版本: v2.3
  • v2.3更新: 新增账号收录功能;未查询到账号时输出收录提示;新增数据亮点模块(互动量TOP3+账号特征分析);数据来源描述统一为"红狐数据API"
  • v2.2更新: 数字格式规范(万→w,≥1亿用亿,<1万千分位);链接列格式固定为[链接](url)/-
  • v2.1更新: 接口新增url字段,支持作品直达链接输出
  • v2.0更新: 切换至 /dyData/queryUserWithWorks 接口,支持近期作品数据爬取
  • v1.0更新: 初始版本