Install
openclaw skills install clean-web-fetch获取干净、可读的现代网页正文内容,支持微信公众号文章抓取与尾部噪音清洗,减少无用信息与 token 消耗;适合新闻、博客、公告及许多普通 fetch 不稳定、存在反爬或动态渲染干扰的网页。Clean readable web fetch for modern pages, with WeChat cleanup,...
openclaw skills install clean-web-fetch当用户要获取网页内容、正文提取、把网页转成 markdown/text、抓取文章主体时,优先使用此技能。
python3 scripts/scrapling_fetch.py <url> <max_chars>articlemain.post-content[class*="body"]html2text 转 Markdownbodymax_chars 截断输出python3 /Users/zzd/.openclaw/workspace/skills/scrapling-web-fetch/scripts/scrapling_fetch.py <url> 30000
优先检查:
scraplinghtml2text若缺失,可安装:
python3 -m pip install scrapling html2text
脚本默认输出 Markdown 正文内容。
如需结构化输出,可追加 --json。
如需调试提取命中了哪个 selector,可查看 stderr 输出。
/Users/zzd/.openclaw/workspace/skills/scrapling-web-fetch/references/usage.md/Users/zzd/.openclaw/workspace/skills/scrapling-web-fetch/references/selectors.md/Users/zzd/.openclaw/workspace/skills/scrapling-web-fetch/scripts/fetch-web-content