Install
openclaw skills install ofdreaderOFD 文档读取和转换工具。支持从 OFD(Open Fixed-layout Document)文件中提取文本内容,并将其转换为 Markdown 格式。使用此 skill 处理 .ofd 文档时:提取纯文本内容、转换为包含基本格式(标题、段落、表格)的 Markdown、处理中文版式文档。OFD 是中国国家标...
openclaw skills install ofdreaderOFD(Open Fixed-layout Document)文档读取和转换工具。从 OFD 文件中提取内容并转换为 Markdown。
python scripts/ofd_to_text.py <ofd文件路径>
输出到文件:
python scripts/ofd_to_text.py <ofd文件路径> output.txt
python scripts/ofd_to_markdown.py <ofd文件路径>
输出到文件:
python scripts/ofd_to_markdown.py <ofd文件路径> output.md
验证文件:确认 OFD 文件存在且格式有效(OFD 本质是 ZIP 压缩包)
提取内容:
格式转换:
输出结果:打印到控制台或写入文件
scripts/ofd_to_text.py:提取纯文本,保留所有文字内容但不处理格式scripts/ofd_to_markdown.py:转换为 Markdown,保留段落、标题和表格结构scripts/install_dependencies.py:安装可选依赖(核心功能使用标准库)OFD 文件结构:
OFD.xml(文档清单)Doc_0/ 目录包含文档内容http://www.ofdspec.org/2016 命名空间关键元素:
TextCode:文本内容Paragraph:段落Table:表格Row/Cell:表格行和单元格格式保真度:OFD 支持复杂的排版布局,脚本仅提取逻辑内容,无法完全保留视觉效果
表格识别:基于 XML 结构推断表格,复杂表格可能转换不完整
标题检测:使用启发式规则(短文本、特定模式),可能误判
编码:OFD 通常使用 UTF-8,脚本自动处理编码
依赖:核心脚本使用 Python 标准库(zipfile, xml.etree.ElementTree),无需额外依赖
提取 OFD 文档文本:
# 用户询问时
python "C:\Users\zhan\.claude\plugins\skills\OfdReader\scripts\ofd_to_text.py" "document.ofd" "extracted.txt"
转换为 Markdown:
python "C:\Users\zhan\.claude\plugins\skills\OfdReader\scripts\ofd_to_markdown.py" "document.ofd" "document.md"
错误:"文件不是有效的 OFD (ZIP) 格式"
错误:"OFD 文件不存在"
提取内容为空
表格格式混乱