Install
openclaw skills install doorstep-screen-control屏幕控制技能 - 通过OpenClaw Node + pyautogui实现电脑屏幕识别和鼠标键盘操控。功能:(1) 截图获取屏幕画面,(2) OCR文字识别定位,(3) 图片匹配定位,(4) 鼠标移动/点击/拖拽,(5) 键盘输入/快捷键,(6) 基于视觉信息的自动化操作。Use when: (1) 需要远程操电脑屏幕,(2) 需要自动操作桌面应用(非浏览器),(3) 需要批量处理电脑上的文件或软件,(4) 需要通过视觉识别自动化操作。Triggers: '操作电脑', '屏幕控制', '自动点击', '截图识别', '桌面自动化', '远程操控', '操控鼠标', '屏幕识别'。
openclaw skills install doorstep-screen-control通过 OpenClaw Node + pyautogui + OCR,实现对电脑屏幕的识别和鼠标键盘操控。
用户指令 → Agent → screen_control.py (pyautogui + OCR) → 屏幕操作
↕
OpenClaw Node (截图/远程执行)
当用户要求操控电脑时:
python {baseDir}/scripts/screen_control.py screenshot
python {baseDir}/scripts/screen_control.py size
获取当前屏幕画面和分辨率,AI识别画面内容。
AI分析截图,确定需要操作的坐标或内容。
locate <image_path>clicktext "确定"click 500 300# 打开浏览器
press_key("win") + type_text("chrome") + press_key("enter")
# 打开网页
type_text("douyin.com\n") # \n = enter
# 拖动
mouse_drag(100, 100, 500, 500)
# 复制粘贴
hotkey("ctrl", "c")
hotkey("ctrl", "v")
再次截图确认操作结果。
| 命令 | 参数 | 说明 |
|---|---|---|
| screenshot | 无 | 截图保存到文件 |
| size | 无 | 获取屏幕分辨率 |
| move | x y | 移动鼠标 |
| click | x y [button] | 点击(按钮: left/right/middle) |
| doubleclick | x y | 双击 |
| text | "文字" | 键盘输入文字 |
| key | key_name | 按键(enter/esc/tab等) |
| locate | image_path | 查找图片位置 |
| findtext | "文字" | 查找文字位置 |
| clicktext | "文字" | 查找并点击文字 |
| scroll | clicks | 滚动(正=上,负=下) |
| color | x y | 获取像素颜色 |
截图 → 定位登录框坐标 → 输入账号密码 → 点击登录按钮
截图 → 找到发布按钮 → 点开 → 上传视频/图片 → 填写标题 → 发布
按Win键 → 搜索程序名 → 回车打开
打开文件夹 → 选中文件 → 执行操作