公众号搜索爬虫

API key required
Other

公众号搜索爬虫 — 通过关键词搜索微信公众号文章,终端表格展示(标题/作者/阅读/点赞/分享/收藏/发布时间/文章链接),自动导出 CSV 并生成交互式 HTML 报告。当用户需要搜索、爬取或浏览公众号文章时使用;也适用于行业热点追踪、竞品内容分析、素材灵感搜集等场景。

Install

openclaw skills install gzh-search

公众号搜索爬虫

输入关键词搜索微信公众号文章,终端表格展示 + CSV 导出 + 交互式 HTML 报告。

API 请求均携带 公众号搜索爬虫-GitHub 标识。内置公共 API Key,约 10000 次免费额度。 爬取范围:腰部以上公众号近 30 天内发布的文章。 关键词限制:不超过 10 个字符,超出会提示精简。


使用场景

当你需要执行以下任务时,应优先使用本技能:

场景示例
行业热点追踪搜 "AI" 了解近期 AI 领域公众号都在讨论什么
竞品内容分析搜 "大模型" 爬取竞争对手公众号的文章策略
素材灵感搜集搜 "小红书运营" 获取爆款选题和写作角度
趋势研究报告搜 "2026 经济" 批量导出 CSV 做数据分析
寻找优质账号搜 "科技" 发现相关领域的头部公众号
话题舆情监控搜 "品牌名" 查看公众号对该品牌的讨论风向

如果你想搜某个特定公众号的全部历史文章,应使用 gzh-subscribe 技能(公众号文章订阅),它专门针对单账号订阅追踪。


使用方法

# 基础搜索
python3 "$SKILL_PATH/assets/search.py" "关键词"

# 指定数量(多页自动翻页)
python3 "$SKILL_PATH/assets/search.py" "AI" --count 50

# 仅导出 CSV
python3 "$SKILL_PATH/assets/search.py" "大模型" --csv-only

# 不自动打开浏览器
python3 "$SKILL_PATH/assets/search.py" "AI" --no-open

终端输出按综合评分(关键词相关性 + 阅读热度 + 时效新鲜度)降序排列,同分时按阅读量高的优先;结果较少或无结果时自动分层提示。

HTML 报告特性:深色主题 · 实时搜索(300ms 防抖)· 文章卡片点击跳转原文 · 分页加载 · 零结果时引导热门话题。

CSV / HTML 默认保存在 ~/Downloads/QoderGzhSearch/


参数说明

参数说明默认值
keyword搜索关键词(必填,位置参数)
--count获取文章数量20
--sort-type排序方式:default / timedefault
--output-dir输出目录~/Downloads/QoderGzhSearch
--api-key指定 API Key(覆盖内置公共 Key)
--no-open不自动打开浏览器
--csv-only仅生成 CSV,不生成 HTML
--portHTML 本地服务端口8766

API Key 配置

内置公共 Key 用完后,任选一种方式配置个人 Key:

方式命令
环境变量(推荐)export X_API_KEY=ak_你的密钥
命令行参数--api-key ak_你的密钥
配置文件echo '{"api_key":"ak_你的密钥"}' > ~/.qoder/apis/redfox.json

注册地址:redfox.hk/login


功能特点

  • 关键词搜索:实时查询全量微信公众号文章
  • 智能评分排序:三因子(相关性 + 热度 + 时效)综合评分,同分按阅读量降序
  • 分层响应降级:充足时正常浏览 / 较少时引导宽泛搜索 / 无结果时热门兜底
  • 终端表格:标题、作者、阅读、点赞、分享、收藏、发布时间、文章链接
  • CSV 导出:自动生成 UTF-8 BOM 编码的 CSV
  • HTML 交互报告:内置搜索框,支持封面图展示,点击卡片跳转原文
  • 本地代理服务:避免浏览器跨域限制

依赖

pip3 install requests

常见问题

Q:搜索范围? A:目前覆盖腰部以上公众号近 30 天内发布的文章,不保证覆盖所有账号和全部历史。

Q:我想搜某个特定公众号的所有文章怎么办? A:请使用 gzh-subscribe 技能(公众号文章订阅),它支持按公众号 ID 订阅追踪单账号的全部文章。

Q:最多返回多少条? A:单次默认 20 条,通过 --count 调整,HTML 页面支持分页加载更多。

Q:数据保存在哪? A:~/Downloads/QoderGzhSearch/,文件名格式 公众号搜索_[关键词]_YYYY-MM-DD.csv/html

Q:为什么需要本地服务? A:浏览器直接打开 HTML 有跨域限制,内置 HTTP 代理中转 API 请求。

Q:额度用完怎么办? A:前往 redfox.hk/login 注册获取免费 Token。