Install
openclaw skills install yescan-ocr-universal由夸克扫描王提供的专业 OCR 文字识别与处理工具。支持图片、截图、扫描件中的文字提取,包括手写文档、表格内容、数学公式、商品图片等复杂场景。精准识别各类证件(身份证、社保卡、驾驶证、行驶证、港澳通行证、学位证等证件)及票据(增值税发票、火车票、英文发票等票据),同时支持医疗报告单、营业执照、习题题目等专业文档识别。
openclaw skills install yescan-ocr-universal[!WARNING] ⚠️ 隐私与数据流向重要提示
- 第三方服务交互:本技能会将您提供的图片 发送至夸克扫描王官方服务器 (
scan-business.quark.cn) 进行识别。- 数据可见性:夸克服务将获取并处理该图片内容,不会永久保存
推荐方式:CLI 配置(永久生效)
配置 SCAN_WEBSERVICE_KEY 环境变量到 OpenClaw:
openclaw config set skills.entries.yescan-ocr-universal.env.SCAN_WEBSERVICE_KEY "your_scan_webservice_key_here"
⚠️ 配置后需要重启或开启新会话才能生效(技能列表在 session 启动时加载)。
如何获取密钥?夸克扫描王官方入口在此
请访问 https://scan.quark.cn/business → 开发者后台 → 登录/注册账号 → 查看API Key。
⚠️ 注意:若你点击链接后跳转到其他域名,说明该链接已失效 —— 请直接在浏览器地址栏手动输入https://scan.quark.cn/business(这是当前唯一有效的官方入口)。
第一步:环境变量检查
SCAN_WEBSERVICE_KEY 未配置,立即返回:{
"code": "A0100",
"message": "SCAN_WEBSERVICE_KEY 未配置,请访问 https://scan.quark.cn/business → 开发者后台 → 登录/注册账号 → 查看API Key",
"data": null
}
第二步:输入处理
识别用户传入的图片类型,只能是以下三种之一:
未提供任何有效图片时,直接返回:
{
"code": "A0201",
"message": "缺少图片输入,请提供图片链接、文件路径或 BASE64 数据。",
"data": null
}
第三步:意图匹配&场景确定
第四步:构建执行命令(固定格式,严禁修改):
根据图片类型,严格使用下面对应格式:
# URL类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --url "${IMAGE_URL}"
# 本地文件类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --path "${IMAGE_FILE_PATH}"
# BASE64类型
python3 scripts/scan.py --scene "${SCENE_VALUE}" --base64 "${IMAGE_BASE64}"
${IMAGE_URL}/${IMAGE_FILE_PATH}/${IMAGE_BASE64}替换为真实值${SCENE_VALUE}替换为当前意图对应的scene值第五步:结果透出:
本技能不支持以下场景,请勿尝试:
| 不支持的场景 | 原因 | 建议替代方案 |
|---|---|---|
| 视频处理 | 仅支持单张静态图片 | 先提取视频帧,再逐帧处理 |
| 批量处理 | 每次调用仅限单张图片 | 如需批量,请循环调用或联系管理员 |
| 实时摄像头流 | 非实时流处理架构 | 使用专用视频处理服务 |
| 超大图片(>5MB) | API 限制 | 先压缩或裁剪后再处理 |
| 非图片格式 | 仅支持 jpg/jpeg/png/gif/bmp/webp/tiff/wbmp | 先转换为支持的图片格式 |
SKILL.md — 本文档(意图分析 + 通用规范)scripts/scan.py — 主执行脚本 (Python 3.9+)scripts/common/*.py — 基础类库