Install
openclaw skills install ccy-ocr-local本地离线 OCR 技能。对本机图片做文字识别,默认不上传文件、不依赖外部 API Key。适用于截图、文档拍照、扫描件、相机图片中的中英文文本提取。
openclaw skills install ccy-ocr-local使用本技能在 本机离线 对图片做 OCR 识别,优先用于:
当用户需要:
若追求复杂版面、票据、表格结构、竖排文本或更强中文效果,优先考虑后续单独做 PaddleOCR / RapidOCR 本地技能。
脚本入口:scripts/local_ocr.py
配套脚本:
scripts/benchmark.py:对样例图比较 balanced / fast / accurate 的耗时和输出长度scripts/regression.py:对样例图生成基线输出,便于回归检查--autorotate 尝试方向并选择更优结果--autorotate-strategy smart,先按宽高比做轻判,只有结果太弱才退回全方向检查--json 输出 OCR 内容和元数据,适合自动化接入最小依赖:
python3tesseractPillow、pytesseract可选增强:
opencv-python
eng、chi_simWindows 兼容说明:
C:/Program Files/Tesseract-OCR/tesseract.exe--tesseract-cmd "C:/Program Files/Tesseract-OCR/tesseract.exe"TESSERACT_CMD这个技能默认在四个方向做平衡:
balanced 模式只做一次识别;需要时才尝试多 PSMimage_path:本地图片路径;配合 --batch 时也可传目录--lang:OCR 语言,默认 eng
eng、chi_sim、chi_sim+eng--psm:显式指定 Tesseract PSM;指定后不再自动试多个模式--mode:balanced / fast / accurate
balanced:默认,单次识别,资源最省fast:自动试少量常见 PSM,兼顾速度accurate:自动试更多 PSM,优先提高命中率--format:text 或 tsv--tesseract-cmd:显式指定 Tesseract 可执行文件路径,适合 Windows / PATH 未继承场景--min-conf:TSV 模式下过滤低置信度文本--dpi:传给 Tesseract 的逻辑 DPI,默认 300--min-edge:小图放大的目标长边,默认 1800--sharpen:启用轻量锐化,适合略糊的图--no-preprocess:关闭基础预处理--out:单图模式下将结果写入文件--batch:批量处理模式--recursive:批量模式下递归扫描子目录--out-dir:批量模式下输出目录,并生成 manifest.json--autorotate:自动尝试方向,适合拍照方向不稳的图片--autorotate-strategy:smart 或 full,默认 smart默认输出:
text:纯文本可选输出:
tsv:带位置和置信度的结构化文本,适合后处理json:包含文本和元数据(耗时、PSM、旋转角度、模式等),适合自动化流水线manifest.jsonmanifest.json 中会记录每张图的耗时、PSM、旋转角度和输出路径错误输出:
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png --lang chi_sim+eng
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png --lang chi_sim+eng --mode accurate --sharpen --autorotate
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png --mode fast
python skills/ccy-ocr-local/scripts/local_ocr.py C:/path/to/image.png --tesseract-cmd "C:/Program Files/Tesseract-OCR/tesseract.exe"
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png --format tsv --min-conf 40 --out /tmp/result.tsv
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/image.png --lang chi_sim+eng --autorotate --json
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/images --batch --recursive --lang chi_sim+eng --out-dir /tmp/ocr-batch
python3 skills/ccy-ocr-local/scripts/local_ocr.py /path/to/images --batch --recursive --lang chi_sim+eng --autorotate --json --out-dir /tmp/ocr-batch-json
python3 skills/ccy-ocr-local/scripts/benchmark.py
python3 skills/ccy-ocr-local/scripts/regression.py
--lang chi_sim+eng--sharpen--autorotate--json 或配合 --out-dirbalanced,不要开 accurate--format tsv--batch --out-dirchi_sim.traineddata,中文识别会失败或效果较差