Install
openclaw skills install x-profile-deep-dive深度分析 X/Twitter 用户画像——通过 tweety-ns 抓取推文、关注和粉丝, 生成中文深度档案(主题分类、内容风格、社交网络)。 Use when: (1) 用户说"深挖 @xxx"/"分析这个博主"/"analyze @xxx", (2) 用户说"看看他都发了什么"/"这个人什么水平"/"值不值得...
openclaw skills install x-profile-deep-dive对 X/Twitter 博主进行深度画像分析:数据采集 → LLM 动态分类 → 摘要卡片 + 分类全集输出。
# 一次性检查三个条件
pip3 show tweety-ns >/dev/null 2>&1 && echo "✅ tweety-ns" || echo "❌ pip3 install tweety-ns"
[ -f <WORKSPACE>/config/twitter_cookies.json ] && echo "✅ cookies" || echo "❌ cookies 缺失"
[ -d <WORKSPACE>/config/tw_session/ ] && echo "✅ session" || echo "❌ session 目录缺失"
Cookies 缺失 → 提示用户通过 CDP 从 openclaw browser 提取。
| 阶段 | 耗时 | 说明 |
|---|---|---|
| Phase 1 数据采集 | 1-2 分钟 | tweety-ns API 调用 |
| Phase 1.5 Articles | 2-5 分钟 | 浏览器滚动,视博主文章数量而定 |
| Phase 2-3 分析+分类 | 1-3 分钟 | 视推文数量而定 |
| Phase 4-5 输出 | 1 分钟 | 文件写入+汇报 |
| 总计 | 5-11 分钟 |
确认点:开始前告知用户预计耗时,确认后再开始。
运行脚本采集原始数据:
python3 scripts/x_profile_analyzer.py \
--handle {handle} \
--tweet-pages 8 \
--cookies <WORKSPACE>/config/twitter_cookies.json \
--output /tmp/x-profile-raw-{handle}.json
参数说明:
--tweet-pages 8:默认 8 页(约 160 条推文),可根据需要调整--following-pages 1:关注列表采样 70 人(通常够用)--follower-pages 1:粉丝采样 70 人(可能因 elevated auth 失败,非关键)脚本退出码:1=cookies missing, 2=login failed, 3=user not found
tweety-ns 的 tweet pages 可能采不全 X Articles(长文),且博主可能在外部平台有独占内容。此步骤必须执行。
用浏览器打开 x.com/{handle}/articles,完整滚动收集所有 Article:
browser navigate → x.com/{handle}/articlesscrollBy(0, 1500)),每段做 snapshot 记录当前可见的 article 标题+日期+URL⚠️ 虚拟滚动陷阱(2026-03-16 教训):
document.querySelectorAll('article').length 只返回当前 DOM 中的数量,不是总数检查博主 bio 中的外部链接(博客/Substack/Medium/Newsletter/GitHub):
读取输出的 JSON,用 Python 提取关键统计信息(参考 data-analysis.md):
确认点(大 V 场景):推文 >500 条时,告知用户分析范围(如"分析最近 160 条,覆盖约 X 天"),确认是否需要扩大采样。
核心步骤——不使用预设分类,而是根据推文内容动态生成分类。
输出结构为一个目录,包含摘要卡片 + 分类全集:
collections/x-profiles/@{handle}/
├── README.md ← 摘要卡片 + 目录导航表
├── {category-1}.md ← 第一个主题分类(推文全文)
├── {category-2}.md ← 第二个主题分类
├── ...
└── network.md ← 社交网络分析
参考 readme-template.md。包含:
每个分类文件:
# {分类名}
> {分类描述}
共 N 条推文
---
## [X,XXX❤️ X,XXX🔁 X,XXX,XXX👁] YYYY-MM-DD
[原文链接](url)
{推文全文,原样保留,不做任何压缩或摘要}
**附带链接**: {如果有}
---
关键原则:推文全文原样保留,不做压缩。
参考 network-template.md。包含:
自检:
完成后向用户汇报:
画像完成后,根据结果判断是否推荐下一步。
| 触发条件 | 推荐 |
|---|---|
| 博主有高质量内容值得长期追踪 | 「这个博主值得加入 X 信息源列表。要加到 x-info-sources 吗?」 |
| 博主的某些推文/文章值得收藏 | 「有几条内容值得单独收藏,用 content-collector 存一下?」 |
| 画像发现博主的方法论可用于公众号选题 | 「这个博主的观点可以做一期公众号文章,用 wemp-ops 写?」 |