Install
openclaw skills install webpage-reader-skill使用Google Chrome无头浏览器下载和读取网页内容,生成摘要并安全处理临时文件以保护隐私。
openclaw skills install webpage-reader-skill网页读取器技能是一个强大的工具,允许您使用Google Chrome的无头浏览器读取和分析网页内容。此技能可以:
from webpage_reader import main
result = main("https://example.com")
if result['success']:
print("网页下载成功!")
print("摘要:")
print(result['summary'])
print("\n内容预览:")
print(result['content'][:500] + "..." if len(result['content']) > 500 else result['content'])
else:
print(f"错误:{result['message']}")
python webpage_reader.py https://example.com
技能使用以下Chrome命令参数以获得最佳性能:
google-chrome --headless=new --no-sandbox --disable-gpu --disable-dev-shm-usage --virtual-time-budget=8000 --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/145.0.0.0 Safari/537.36" --hide-scrollbars --blink-settings=imagesEnabled=true --dump-dom <url>
技能返回具有以下结构的字典:
{
"success": bool, # 操作是否成功
"message": str, # 状态消息
"content": str, # 网页的完整HTML内容
"summary": str # 网页内容摘要
}
未找到Chrome
权限错误
超时错误
download_webpage函数中修改超时时间。内容为空
编码错误
read_webpage_content函数中的编码处理。技能生成详细的日志以帮助诊断问题。日志默认输出到控制台,但可以配置为写入文件(如果需要)。
欢迎贡献!请随时提交Pull Request。
此技能以MIT许可证发布。有关详细信息,请参阅LICENSE文件。
如果您遇到任何问题或有疑问,请在GitHub存储库上打开一个issue。