{"skill":{"slug":"screen-capture-hub","displayName":"一个功能强大的屏幕浏览、OCR识别和屏幕分析技能包，专为AI助手设计","summary":"此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括：使用Python PIL库捕获整个屏幕或特定区域的截图；保存截图到指定位置；分析截图中的文字内容（支持中英文OCR识别）；对截图进行基本图像处理（裁剪、旋转、调整大小）。当用户提到\"屏幕截图\"、\"截屏\"、\"查看屏幕\"或需要分析屏幕上的内容...","description":"---\r\nname: openclaw-screen-viewer\r\ndisplayName: OPENCLAW(龙虾)-屏幕查看器\r\ndescription: 此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括：使用Python PIL库捕获整个屏幕或特定区域的截图；保存截图到指定位置；分析截图中的文字内容（支持中英文OCR识别）；对截图进行基本图像处理（裁剪、旋转、调整大小）。当用户提到\"屏幕截图\"、\"截屏\"、\"查看屏幕\"或需要分析屏幕上的内容时，使用此技能。\r\nversion: 1.0.0\r\nauthor: CodeBuddy User\r\nlicense: MIT\r\nkeywords:\r\n  - 屏幕截图\r\n  - OCR识别\r\n  - 文字提取\r\n  - 屏幕分析\r\n  - 图像处理\r\n  - 中文识别\r\n  - openclaw\r\ncategories:\r\n  - 图像处理\r\n  - OCR\r\n  - 屏幕工具\r\n  - AI助手\r\n---\r\n\r\n# OPENCLAW(龙虾)-屏幕查看器\r\n\r\n## 概述\r\n\r\n此技能提供了使用Python进行屏幕截图和图像处理的功能。它依赖于Pillow (PIL) 和pyautogui库来捕获屏幕内容，并可选择性地使用pytesseract进行OCR文字识别。\r\n\r\n## 安装依赖\r\n\r\n### 方法1：一键安装（推荐）\r\n```bash\r\npython scripts/setup.py\r\n```\r\n\r\n### 方法2：手动安装\r\n\r\n**必需依赖**（基础功能）：\r\n```bash\r\npip install pillow pyautogui\r\n```\r\n\r\n**可选依赖**（OCR功能）：\r\n```bash\r\npip install pytesseract\r\n```\r\n\r\n**Tesseract OCR引擎**（OCR功能必需）：\r\n- Windows: 运行 `python scripts/install_tesseract.py` 自动安装\r\n- Windows (手动): 从 https://github.com/UB-Mannheim/tesseract/wiki 下载安装\r\n- macOS: `brew install tesseract`\r\n- Linux: `sudo apt-get install tesseract-ocr`\r\n\r\n**可选依赖**（高级分析功能）：\r\n```bash\r\npip install opencv-python numpy\r\n```\r\n\r\n### 验证安装\r\n```bash\r\n# 检查所有依赖\r\npython scripts/dependency_check.py\r\n\r\n# 测试截图功能\r\npython scripts/test_screenshot.py\r\n\r\n# 测试OCR功能\r\npython scripts/test_ocr.py\r\n\r\n# 运行所有示例\r\npython examples/run_examples.py\r\n```\r\n\r\n## 使用方法\r\n\r\n### 基本屏幕截图\r\n\r\n使用`scripts/screenshot.py`脚本捕获整个屏幕：\r\n\r\n```python\r\npython scripts/screenshot.py --output screenshot.png\r\n```\r\n\r\n捕获特定区域：\r\n```python\r\npython scripts/screenshot.py --output screenshot.png --region \"100,100,500,500\"\r\n```\r\n\r\n### 文字识别\r\n\r\n使用`scripts/ocr_screenshot.py`脚本捕获屏幕并识别文字：\r\n\r\n```python\r\npython scripts/ocr_screenshot.py --output screenshot.png --text-output text.txt\r\n```\r\n\r\n### 分析屏幕内容\r\n\r\n使用`scripts/analyze_screen.py`脚本进行更复杂的分析：\r\n\r\n```python\r\npython scripts/analyze_screen.py --task find_text --text \"搜索词\"\r\n```\r\n\r\n## 工作流程\r\n\r\n当用户请求屏幕相关操作时：\r\n\r\n1. **确定需求** - 明确用户需要的是截图、文字识别还是其他分析\r\n2. **选择脚本** - 根据需求选择合适的脚本\r\n3. **设置参数** - 配置输出路径、区域等参数\r\n4. **执行脚本** - 运行相应的Python脚本\r\n5. **处理结果** - 将结果展示给用户或进行进一步分析\r\n\r\n## 常见任务\r\n\r\n### 任务1：快速截图\r\n- 使用：`scripts/screenshot.py`\r\n- 参数：`--output` 指定输出文件路径\r\n- 示例：捕获整个屏幕并保存为当前目录的screenshot.png\r\n\r\n### 任务2：区域截图\r\n- 使用：`scripts/screenshot.py`\r\n- 参数：`--region \"x1,y1,x2,y2\"`\r\n- 示例：捕获屏幕左上角500x500像素区域\r\n\r\n### 任务3：屏幕文字提取\r\n- 使用：`scripts/ocr_screenshot.py`\r\n- 参数：`--text-output` 指定文本输出文件\r\n- 示例：捕获屏幕并提取所有文字保存到text.txt\r\n\r\n### 任务4：查找特定内容\r\n- 使用：`scripts/analyze_screen.py`\r\n- 参数：`--task find_text --text \"搜索内容\"`\r\n- 示例：在屏幕上查找特定文字并高亮显示\r\n\r\n## 注意事项\r\n\r\n1. **权限**：某些应用程序可能需要管理员权限才能捕获其窗口内容\r\n2. **性能**：高分辨率屏幕截图可能需要较多内存\r\n3. **OCR准确性**：文字识别准确性受字体、背景、分辨率影响\r\n4. **多显示器**：脚本默认捕获主显示器，多显示器环境需要特殊处理\r\n\r\n## 故障排除\r\n\r\n如果截图失败：\r\n1. 检查Python库是否正确安装\r\n2. 确认有足够的权限\r\n3. 尝试降低分辨率或捕获特定区域\r\n\r\n如果OCR识别不准确：\r\n1. 确保Tesseract正确安装\r\n2. 尝试预处理图像（二值化、去噪）\r\n3. 指定语言参数（如`--lang chi_sim`用于简体中文）\r\n","tags":{"latest":"1.0.0"},"stats":{"comments":0,"downloads":1089,"installsAllTime":2,"installsCurrent":2,"stars":0,"versions":1},"createdAt":1773549800014,"updatedAt":1778999964275},"latestVersion":{"version":"1.0.0","createdAt":1773549800014,"changelog":"openclaw-screen-viewer 1.0.0 – Initial release\n\n- Adds Python-based screen capture and image processing capabilities (full screen or region).\n- Supports screenshot saving, text extraction via OCR (Chinese and English), and basic image editing (crop, rotate, resize).\n- Provides scripts for quick capture, OCR, region selection, and screen content analysis.\n- Includes detailed usage, installation, and troubleshooting instructions for multiple platforms.","license":"MIT-0"},"metadata":{"setup":[],"os":null,"systems":null},"owner":{"handle":"datappt8","userId":"s1760n0z3a9cam2b5sdwamez1d884m0z","displayName":"datappt8","image":"https://avatars.githubusercontent.com/u/161408840?v=4"},"moderation":{"isSuspicious":false,"isMalwareBlocked":false,"verdict":"clean","reasonCodes":["review.llm_review"],"summary":"Review: review.llm_review","engineVersion":"v2.4.24","updatedAt":1780089892199}}