Install
openclaw skills install fast-ocr专业离线票据OCR,支持增值税发票、火车票、飞机票、出租车票等多种票据的高精度结构化识别与批量处理。
openclaw skills install fast-ocrFastOCR 是一款专业的票据 OCR 识别工具,支持增值税发票、火车票、飞机票、出租车票等各类票据的高精度识别。
基于 ONNX 推理引擎,无需深度学习框架,轻量快速,完全离线运行。
exec()、eval() 等危险函数os.system()、subprocess 等增值税发票识别
典型用户: 财务人员、会计、出纳、报销专员
效率提升:
批量票据处理
典型用户: 中小企业、创业公司、财务部门
成本节省:
交通票据识别
典型用户: 行政人员、差旅管理员、HR
管理价值:
医疗发票识别
典型用户: 保险公司、医疗机构、个人用户
应用价值:
购物小票识别
典型用户: 市场调研、消费者、记账用户
数据分析:
通用文字识别
典型用户: 学生、办公人员、研究人员
效率工具:
用户可能会搜索:
pip install rapidocr-onnxruntime
用户:识别这张发票
助手:call 票据识别 invoice.jpg
输出:
{
"invoice_type": "增值税专用发票",
"invoice_code": "3200153160",
"invoice_number": "00362801",
"invoice_date": "2016 年 04 月 26 日",
"buyer_tax_id": "110101251328321",
"seller_tax_id": "32040700DKD0337",
"amount_with_tax": 20000.00,
"tax_amount": 2905.98,
"tax_rate": "17%"
}
用户:识别这张火车票
助手:call 火车票识别 train_ticket.jpg
输出:
{
"ticket_type": "火车票",
"ticket_number": "A002572",
"train_number": "C2275",
"from_station": "北京南",
"to_station": "天津",
"datetime": "2008 年 08 月 22 日 12:35 开",
"seat_class": "一等座",
"carriage": "05 车",
"seat_number": "009 号",
"price": 69.00
}
用户:把这张截图的文字提取出来
助手:call 文字识别 screenshot.png
输出:
完整识别文本...
用户:批量识别这些发票
助手:call 批量识别 ./invoices/ output.txt
输出:
已识别 15 张图片,文字已保存到 output.txt
{
"success": true,
"invoice_basic": {
"invoice_code": "3200153160",
"invoice_number": "00362801",
"invoice_date": "2016 年 04 月 26 日",
"invoice_type": "增值税专用发票",
"check_code": "12345678901234567890"
},
"buyer": {
"name": "北京 XXX 公司",
"tax_id": "91110108MA01G7XQ6K",
"address_phone": "北京市海淀区 XXX 路 XXX 号 010-12345678",
"bank": "工商银行北京分行 XXX 支行 1234567890123456789"
},
"seller": {
"name": "江苏 XXX 公司",
"tax_id": "91320000MA1K3YJQ9E",
"address_phone": "江苏省南京市 XXX 路 XXX 号 025-87654321",
"bank": "建设银行南京分行 XXX 支行 9876543210987654321"
},
"amount": {
"amount_without_tax": 17094.02,
"tax_amount": 2905.98,
"amount_with_tax": 20000.00,
"tax_rate": "17%"
},
"other": {
"payee": "张三",
"reviewer": "李四",
"drawer": "王五",
"remark": "备注信息"
}
}
{
"success": true,
"ticket_type": "火车票",
"ticket_basic": {
"ticket_number": "A002572",
"train_number": "C2275",
"datetime": "2008 年 08 月 22 日 12:35 开",
"train_model": "和谐号"
},
"journey": {
"from_station": "北京南",
"to_station": "天津"
},
"seat": {
"seat_class": "一等座",
"carriage": "05 车",
"seat_number": "009 号"
},
"price": {
"amount": 69.00
}
}
{
"success": true,
"image_path": "xxx.jpg",
"full_text": "完整识别文本...",
"lines": [
{"text": "第一行文字", "confidence": 0.95},
{"text": "第二行文字", "confidence": 0.87}
],
"elapsed_ms": 234
}
| 票据类型 | 字段提取率 | 识别时间 | 准确率 |
|---|---|---|---|
| 增值税发票 | 83%+ | ~500ms | 90%+ |
| 火车票 | 100% | ~400ms | 95%+ |
| 飞机票 | 85%+ | ~450ms | 90%+ |
| 出租车票 | 80%+ | ~300ms | 85%+ |
| 通用文字 | 95%+ | ~300ms | 95%+ |
注: 实际识别率受图片质量、光线、角度等因素影响
# 自定义模型路径
RAPIDOCR_MODEL_PATH=/path/to/models
# 是否使用 GPU 加速(需要 onnxruntime-gpu)
RAPIDOCR_USE_GPU=false
# 置信度阈值(低于此值的识别结果会被标记)
RAPIDOCR_CONFIDENCE_THRESHOLD=0.6
MIT License
最后更新: 2026-03-13
版本: 1.1.0
作者: OpenClaw