Install
openclaw skills install browser-agent通过 Chrome DevTools Protocol 直接控制浏览器,实现登录状态复用和多场景自动化操作,支持 Windows 和 OpenClaw 集成。
openclaw skills install browser-agent浏览器自动化 Agent 技能,基于 Chrome DevTools Protocol (CDP) 和 WebSocket 实现 AI 对浏览器的直接控制。支持 OpenClaw 浏览器工具的原生集成,让 AI 能够像人类一样操作浏览器。
方式 1: 使用 OpenClaw 内置浏览器(推荐)
OpenClaw 的 browser 工具已自动配置 CDP,无需额外设置:
browser(action="start") # 自动启动并配置
方式 2: 自行启动 Chrome
需要添加 --remote-allow-origins 标志允许 WebSocket 连接:
# Windows
chrome.exe --remote-debugging-port=9222 --remote-allow-origins=* --user-data-dir="C:\chrome-profile"
# macOS
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome \
--remote-debugging-port=9222 --remote-allow-origins=* \
--user-data-dir="/tmp/chrome-profile"
⚠️ 注意: Chrome 90+ 版本默认拒绝 WebSocket 连接,必须添加 --remote-allow-origins=* 或指定具体 origin。
# 检查浏览器连接
python skills/browser-agent/scripts/browser_agent.py --check
# 执行页面自动化任务
python skills/browser-agent/scripts/browser_agent.py --url "https://example.com" --action "screenshot"
# 执行自定义脚本
python skills/browser-agent/scripts/browser_agent.py --script "my_automation.py"
# OpenClaw 内置 browser 工具已支持 CDP
browser(action="start") # 启动浏览器
browser(action="navigate", url="https://x.com") # 导航
browser(action="snapshot", refs="aria") # 获取页面快照
browser(action="act", kind="click", ref="e123") # 点击元素
browser(action="act", kind="type", text="内容") # 输入文本
┌─────────────────┐ WebSocket ┌─────────────────┐
│ AI Agent │ ◄────────────────► │ Chrome CDP │
│ (OpenClaw) │ CDP Protocol │ (Port 9222) │
└─────────────────┘ └─────────────────┘
│ │
│ ▼
│ ┌─────────────────┐
│ │ Browser UI │
│ │ (Visible/Headless)
▼ └─────────────────┘
┌─────────────────┐
│ Skill Scripts │
│ - browser_agent.py │
│ - cdp_connector.py │
│ - session_manager.py│
└─────────────────┘
# 检查 Chrome 是否启动
netstat -ano | findstr 9222
# 重启 Chrome 远程调试
taskkill /F /IM chrome.exe
chrome.exe --remote-debugging-port=9222
scripts/cdp_connector.py)--user-data-dir 固定配置文件目录scripts/session_manager.py)