Install
openclaw skills install document-parse-ocr支持文档智能识别(异步),适用于大批量文档处理场景。提交公网可访问的文件 URL,自动识别文档中的文本、表格、标题等结构信息,返回结构化的 JSON 结果文件下载地址。
openclaw skills install document-parse-ocr本技能封装了 Scnet OCR 文档智能服务的异步 API,支持提交公网可访问的文件 URL,自动进行文档解析(文本、表格、标题等),并通过轮询获取识别结果。
⚠️ 重要:使用前需要申请 Scnet API Token
sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx)手动配置(推荐)
config/.env 文件,内容如下:# ===== Sugon-Scnet OCR API 配置 =====
# 申请地址:https://www.scnet.cn
SCNET_API_KEY=your_scnet_api_key_here
# API 基础地址(一般无需修改)
SCNET_API_BASE=https://api.scnet.cn/api/llm/v1
2.添加:SCNET_API_KEY=你的密钥
3.设置文件权限为 600(仅所有者可读写) ⚠️ 安全警告:切勿将 API Key 直接粘贴到聊天对话中,否则可能被记录或泄露。
Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNET_API_KEY。
本技能需要 Python 3.6+ 和 requests 库。请运行以下命令:
pip install requests
| 参数名 | 类型 | 必填 | 描述 |
|---|---|---|---|
| ocrType | string | 否 | 识别类别,目前仅支持:<br>• DOC_PARSING(默认值) |
| fileUrl | string | 是 | 待处理文件的公网可访问下载地址(支持 HTTP/HTTPS) |
python .claude/skills/document_parse_ocr/scripts/main.py DOC_PARSING "https://example.com/document.pdf"
如果省略 ocrType,可只传 fileUrl:
python scripts/main.py "https://example.com/document.pdf"
用户可以说:
AI 会根据 description 中的关键词自动触发本技能。
由于任务异步处理,技能内部会自动轮询(最长等待 10 分钟,可配置)。建议在调用时设置较长的 timeout(如 600 秒),避免因轮询超时导致命令中断.
编辑 config/.env 文件:
| 变量名 | 默认值 | 说明 |
|---|---|---|
| SCNET_API_KEY | 必需 | Scnet API 密钥 |
| SCNET_API_BASE | https://api.scnet.cn/api/llm/v1 | API 基础地址(一般无需修改) |
| 问题 | 解决方案 |
|---|---|
| 配置文件不存在 | 创建 config/.env 并填入 Token(参考前置配置) |
| API Key 无效/过期 | 重新申请 Token 并更新 .env 文件 |
| 文件 URL 无法访问 | 确保 URL 是公网可下载的,且无防火墙限制 |
| 网络连接失败 | 检查网络连接或防火墙设置 |
| 任务长时间 running | 检查文档大小是否超过限制(联系服务商) |
| 401/403/Unauthorized | Token 无效或过期,重新申请并配置 |
| 429 Too Many Requests | 请求过于频繁,技能会自动等待并重试(最多 3 次) |
| 任务失败 (failed) | 检查 error_code 和 error_message,常见原因:文件格式不支持、内容违规等 |