Scnet Ocr

API key required
Other

将图片中的文字、通用文字识别, 票据混贴识别, 印章文字识别,居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证, 中国香港身份证, 外国人永久居留身份证, 结婚证, 不动产权证书, 机动车行驶证正页, 机动车行驶证副页, 机动车驾驶证正页, 机动车驾驶证副页, 中国护照, 学历证书, 学历证书电子注册备案表, 学位证书。营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书, 财务票据统一识别, 增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票等信息识别并提取出来。本技能应在用户需要 OCR 识别图片中的文字,或识别通用文字识别, 居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证, 营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书, 增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票, 银行汇票, 银行承兑汇票, 电子银行承兑汇票, 商业承兑汇票, 电子商业承兑汇票, 银行支票, 银行回单, 进账单, 电汇凭证, 支款凭证, 移动支付账单时使用。

Install

openclaw skills install scnet-ocr

Sugon-Scnet 通用 OCR 技能

本技能封装了 Sugon-Scnet 通用 OCR 服务,通过单一接口即可调用 57 种识别能力,高效提取文字及票据信息。

功能特性

  • 通用文字识别:提取图片中的全部文字,印章要素内容识别,支持横竖版及坐标定位。
  • 个人证照:识别居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证, 中国香港身份证, 外国人永久居留身份证, 结婚证, 不动产权证书, 机动车行驶证正页, 机动车行驶证副页, 机动车驾驶证正页, 机动车驾驶证副页, 中国护照, 学历证书, 学历证书电子注册备案表, 学位证书。
  • 行业资质:识别营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书。
  • 财务票据:覆盖增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票,自动提取关键字段。
  • 金融单据:银行汇票, 银行承兑汇票, 电子银行承兑汇票, 商业承兑汇票, 电子商业承兑汇票, 银行支票, 银行回单, 进账单, 电汇凭证, 支款凭证, 移动支付账单。

前置配置

⚠️ 重要:使用前需要申请 Scnet API Token

申请 API Token

  1. 访问 Scnet 官网 注册/登录
  2. 在控制台申请 API 密钥(格式:sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
  3. 复制密钥备用

配置 Token

手动配置(推荐)

  1. 在技能目录下创建 config/.env 文件,内容如下:
# =====  Sugon-Scnet OCR API 配置 =====
# 申请地址:https://www.scnet.cn
SCNET_API_KEY=your_scnet_api_key_here

# API 基础地址(一般无需修改)
SCNET_API_BASE=https://api.scnet.cn/api/llm/v1
  1. 添加:SCNET_API_KEY=你的密钥
  2. 设置文件权限为 600(仅所有者可读写) ⚠️ 安全警告:切勿将 API Key 直接粘贴到聊天对话中,否则可能被记录或泄露。

Token 更新

Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNET_API_KEY。

依赖安装

本技能需要 Python 3.6+ 和 requests 库。请运行以下命令:

   pip install requests

使用方法

参数说明

参数名类型必填描述
ocrTypestring识别类型枚举。必须为以下之一:<br>• GENERAL(通用文字)<br>• BILL_MIXING_AND_IDENTIFICATION(票据混贴识别)<br>• SEAL_CHARACTER_RECOGNITION(印章文字识别)<br>• ID_CARD(居民身份证)<br>• BANK_CARD(银行卡)<br>• SOCIAL_SECURITY_CARD(社保卡)<br>• HOUSEHOLD_REGISTER(户口本)<br>• BIRTH_CERTIFICATE(出生医学证明)<br>• HK_MACAU_PASS(往来港澳通行证)<br>• TAIWAN_PASS(往来台湾通行证)<br>• TAIWAN_MAINLAND_PASS(台湾居民来往大陆通行证)<br>• HK_MAINLAND_PASS(港澳居民来往内地通行证)<br>• HONG_KONG_IDENTITY_CARD(中国香港身份证)<br>• PERMANENT_RESIDENCE_ID_CARD_FOR(外国人永久居留身份证)<br>• MARRIAGE_CERTIFICATE(结婚证)<br>• REAL_ESTATE_OWNERSHIP_CERTIFICAT(不动产权证书)<br>• FRONT_PAGE_OF_MOTOR_VEHICLE_DRIV(机动车行驶证正页)<br>• SECOND_SHEET_OF_MOTOR_VEHICLE_DR(机动车行驶证副页)<br>• MOTOR_VEHICLE_DRIVING_LICENSE(机动车驾驶证正页)<br>• MOTOR_VEHICLE_DRIVING_LICENSE_SU(机动车驾驶证副页)<br>• CHINESE_PASSPORT(中国护照)<br>• ACADEMIC_CERTIFICATE(学历证书)<br>• ONLINE_VERIFICATION_REPORT_OF_HE(学历证书电子注册备案表)<br>• DIPLOMA(学位证书)<br>• BUSINESS_LICENSE(营业执照)<br>• SOCIAL_ORG_REG(社会团体法人登记证书)<br>• TRADE_UNION_REG(工会法人资格证书)<br>• RELIGIOUS_ACTIVITY_REG(宗教活动场所登记证)<br>• PRIVATE_NON_ENTERPRISE_REG(民办非企业单位登记证书)<br>• INSTITUTION_LEGAL_REG(事业单位法人证书)<br>• UNIFIED_SOCIAL_CREDIT_REG(统一社会信用代码证书)<br>• UNIFIED_IDENTIFICATION_OF_FINANC(财务票据统一识别)<br>• VAT_INVOICE(增值税发票)<br>• VAT_ROLL_INVOICE(增值税卷票)<br>• TAXI_INVOICE(出租车发票)<br>• TRAIN_TICKET(火车票)<br>• AIRPORT_TICKET(航空运输电子客票行程单)<br>• VEHICLE_SALE_INVOICE(机动车销售统一发票)<br>• QUOTA_INVOICE(定额发票)<br>• TOLL_INVOICE(过路过桥费发票)<br>• MEDICAL_INVOICE(医疗门诊发票)<br>• TAX_CERTIFICATE(税收完税证明)<br>• SHIP_TICKET(船票)<br>• NON_TAX_BILL(非税票据)<br>• GENERAL_MACHINE_INVOICE(通用机打发票)<br>• BUS_TICKET(汽车票)<br>• BANK_DRAFT(银行汇票)<br>• BANK_ACCEPTANCE_BILL(银行承兑汇票)<br>• ELECTRONIC_BANK_ACCEPTANCE_BILL(电子银行承兑汇票)<br>• COMMERCIAL_ACCEPTANCE_BILL(商业承兑汇票)<br>• ELECTRONIC_COMMERCIAL_ACCEPTANCE(电子商业承兑汇票)<br>• BANK_CHECK(银行支票)<br>• BANK_RECEIPT(银行回单)<br>• DEPOSIT_SLIP(进账单)<br>• TELEGRAPHIC_TRANSFER_VOUCHER(电汇凭证)<br>• WITHDRAWAL_VOUCHER(支款凭证)<br>• MOBILE_PAYMENT_BILL(移动支付账单)
filePathstring待识别图片的本地绝对路径。支持 jpg、png、pdf 等常见格式。

命令行调用示例

   python .claude/skills/scnet-ocr/scripts/main.py VAT_INVOICE /path/to/invoice.jpg

在 AI 对话中使用

用户可以说:

  • “帮我识别这张身份证,图片在 /Users/name/Downloads/id.jpg”
  • “提取这张发票的信息,路径是 /Users/name/Downloads/fapiao.png”
  • “OCR 这个图片里的文字,图片在 /Users/name/Desktop/text.png”

AI 会根据 description 中的关键词自动触发本技能。

AI 调用建议

为避免触发 API 速率限制(10 QPS),请串行调用本技能,即等待前一个识别完成后再发起下一个请求。 如果使用 OpenClaw 的 exec 工具,建议设置 timeout 或 yieldMs 参数,让命令同步执行,避免多个命令同时运行导致并发。

配置选项

编辑 config/.env 文件:

变量名默认值说明
SCNET_API_KEY必需Scnet API 密钥
SCNET_API_BASEhttps://api.scnet.cn/api/llm/v1API 基础地址(一般无需修改)

输出

  • 标准输出:识别结果的 JSON 数据,结构与 API 文档一致,位于 data 字段内。
  • 识别结果位于 data[0].result[0].elements 中,具体字段取决于 ocrType。
  • 识别结果位于 data[0].result[0].stamps 中,具体字段取决于 ocrType。
  • 错误信息:如果发生错误,会输出以 错误: 开头的友好提示。

注意事项

  • 本技能调用的 OCR API 有 10 QPS 的速率限制。
  • 如果遇到 429 错误,请等待 2-3 秒后重试,不要连续发起请求。
  • 建议在调用前确保图片已准备就绪,避免因网络问题导致重复调用。

故障排除

问题解决方案
配置文件不存在创建 config/.env 并填入 Token(参考前置配置)
API Key 无效/过期重新申请 Token 并更新 .env 文件
文件不存在检查提供的文件路径是否正确
网络连接失败检查网络连接或防火墙设置
不支持的文件类型确保文件扩展名为允许的类型(参考 API 文档)
401/403/UnauthorizedToken 无效或过期,重新申请并配置
429 Too Many Requests请求过于频繁,技能会自动等待并重试(最多 3 次)。若持续失败,请降低调用频率或联系服务方提高限额。