Install
openclaw skills install @fangdeqian/invoice-recognition支持增值税发票、普通发票、区块链发票等多种票据的OCR识别与信息提取;自动完成票据类型分类、关键字段提取、格式校验;当用户需要识别发票内容、提取发票信息、校验发票格式时使用
openclaw skills install @fangdeqian/invoice-recognition| 格式类型 | 处理方式 |
|---|---|
| 图片文件(JPG/PNG/BMP) | 直接进行图像识别 |
| PDF文档 | 调用脚本转换为图片后识别 |
| OFD文档 | 调用脚本转换为图片后识别(需额外安装ofd2pdf库) |
如需处理PDF文件,确保已安装必要工具:
# 安装PDF处理依赖(脚本执行前需要)
pip install pdf2image==1.16.3 Pillow==10.0.0
如需处理OFD文件,需要额外安装:
pip install ofd2pdf
scripts/pdf_to_image.py 转换为图片scripts/pdf_to_image.py 转换为图片(需安装ofd2pdf库)根据发票特征自动识别类型:
分类标准:
格式校验:检查各字段格式是否符合规范
逻辑校验:验证金额之间的逻辑关系
注意:本技能不提供自动API调用查验,仅提供操作指导。用户需手动访问官方平台进行查验。
{
"invoice_type": "增值税普通发票",
"invoice_code": "144031900110",
"invoice_number": "12345678",
"invoice_date": "2024-01-15",
"buyer": {
"name": "购买方名称",
"tax_number": "91440300XXXXXXXXX"
},
"seller": {
"name": "销售方名称",
"tax_number": "91440300XXXXXXXXX"
},
"line_items": [
{
"description": "商品名称",
"quantity": 1,
"unit_price": 100.00,
"amount": 100.00,
"tax_rate": 0.13,
"tax_amount": 13.00
}
],
"subtotal": 100.00,
"tax_amount": 13.00,
"total_amount": 113.00,
"check_code": "12345678901234567890",
"validation": {
"format_valid": true,
"logic_valid": true
}
}
当OCR识别不完整时:
input_path(输入文件路径)、output_path(输出图片路径)pip install ofd2pdf场景:用户上传了一张增值税发票图片,需要提取发票信息
执行步骤:
场景:用户上传了一个PDF格式的电子发票,需要提取发票信息
执行步骤:
scripts/pdf_to_image.py 将PDF转换为图片场景:用户提供了发票信息文本,需要校验格式是否正确
执行步骤: