Install
openclaw skills install cnbblogs-pick抓取博客园精华区文章标题和正文,支持指定页数批量下载并保存为纯文本文件。
openclaw skills install cnbblogs-pick抓取博客园(cnblogs.com)精华区内容,支持分页、批量下载标题和正文。
# 抓取第 1 页,保存所有文章到指定目录
openclaw cnblogs-pick --page 1 --output-dir /path/to/output
# 抓取前 3 页,保存所有文章
openclaw cnblogs-pick --pages 3 --output-dir /path/to/output
# 抓取指定 URL 的精华列表
openclaw cnblogs-pick --url https://www.cnblogs.com/pick/ --pages 2
| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
--url | string | 否 | https://www.cnblogs.com/pick/ | 精华列表页 URL |
--page | int | 否 | 1 | 单页抓取页数(仅当 --pages 未指定时有效) |
--pages | int | 否 | 1 | 总页数(优先于 --page) |
--output-dir | string | 否 | ~/.openclaw/workspace/user_cnglobs/ | 输出目录 |
--agent | string | 否 | Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:149.0) Gecko/20100101 Firefox/149.0 | User-Agent |
每篇文章保存为独立文件,命名格式:
{标题}.txt
标题中的特殊字符会被替换为下划线。
post-item-title 类链接cnblogs_post_body 内容并去除 HTML 标签# 抓取前 5 页精华内容
openclaw cnblogs-pick --pages 5 --output-dir /tmp/cnb-pick
# 查看结果
ls -lh /tmp/cnb-pick/
curl - HTTP 请求grep -oP - Perl 正则表达式sed - 文本处理