Install
openclaw skills install screen-capture-hub此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括:使用Python PIL库捕获整个屏幕或特定区域的截图;保存截图到指定位置;分析截图中的文字内容(支持中英文OCR识别);对截图进行基本图像处理(裁剪、旋转、调整大小)。当用户提到"屏幕截图"、"截屏"、"查看屏幕"或需要分析屏幕上的内容...
openclaw skills install screen-capture-hub此技能提供了使用Python进行屏幕截图和图像处理的功能。它依赖于Pillow (PIL) 和pyautogui库来捕获屏幕内容,并可选择性地使用pytesseract进行OCR文字识别。
python scripts/setup.py
必需依赖(基础功能):
pip install pillow pyautogui
可选依赖(OCR功能):
pip install pytesseract
Tesseract OCR引擎(OCR功能必需):
python scripts/install_tesseract.py 自动安装brew install tesseractsudo apt-get install tesseract-ocr可选依赖(高级分析功能):
pip install opencv-python numpy
# 检查所有依赖
python scripts/dependency_check.py
# 测试截图功能
python scripts/test_screenshot.py
# 测试OCR功能
python scripts/test_ocr.py
# 运行所有示例
python examples/run_examples.py
使用scripts/screenshot.py脚本捕获整个屏幕:
python scripts/screenshot.py --output screenshot.png
捕获特定区域:
python scripts/screenshot.py --output screenshot.png --region "100,100,500,500"
使用scripts/ocr_screenshot.py脚本捕获屏幕并识别文字:
python scripts/ocr_screenshot.py --output screenshot.png --text-output text.txt
使用scripts/analyze_screen.py脚本进行更复杂的分析:
python scripts/analyze_screen.py --task find_text --text "搜索词"
当用户请求屏幕相关操作时:
scripts/screenshot.py--output 指定输出文件路径scripts/screenshot.py--region "x1,y1,x2,y2"scripts/ocr_screenshot.py--text-output 指定文本输出文件scripts/analyze_screen.py--task find_text --text "搜索内容"如果截图失败:
如果OCR识别不准确:
--lang chi_sim用于简体中文)