Install
openclaw skills install document-translateOffice文档翻译工具集。用于翻译和本地化办公文档(PPT/Word/PDF/Excel),保持原文档模板和格式不变。当用户说"翻译PPT"、"翻译Word文档"、"翻译PDF"、"翻译Excel"、"翻译文档"、"文档本地化"、"英文文档翻译成中文"时使用本技能。支持PPT/Word/PDF/Excel四种格式的英文到中文(或任意语言)的翻译任务。
openclaw skills install document-translateOffice document translation toolkit / Office文档翻译工具集
Supports PPTX / DOCX / PDF / XLSX four formats, preserving original templates and styles / 支持四种格式,保持原模板不变。
1. 下载文件 / Download file → 飞书附件 or 本地路径 / Feishu attachment or local path
2. 格式识别 / Detect format → 根据扩展名判断 / Detect by extension
3. 解压解析 / Extract & parse → ZIP解压 → XML/文本节点提取 / ZIP extract → XML/text node extraction
4. 翻译 / Translate → 规则映射或AI翻译 / Rule mapping or AI translation
5. 重建 / Rebuild → 重新打包,保留原样式 / Repack, preserve original styles
6. 发送 / Deliver → 发送给用户或保存 / Send to user or save
PPTX = ZIP压缩包,内含 / ZIP archive containing:
ppt/slides/slide1.xml … slideN.xml — 幻灯片内容 / Slide contentppt/theme/ — 主题样式 / Theme styles[Content_Types].xml — 内容类型声明 / Content type declarations| 节点 / Node | 说明 / Description |
|---|---|
<a:t> | 文本内容 / Text content(最常出现 / most common) |
<a:r> | 文本段落 / Text run |
<p:sp> | 形状(文本框等)/ Shape(text box etc.) |
<p:txBody> | 文本正文 / Text body |
python3 scripts/pptx_translate.py <pptx文件路径> [--output <输出路径>] [--src-lang en] [--tgt-lang zh]
DOCX = ZIP压缩包,内含 / ZIP archive containing:
word/document.xml — 主文档内容 / Main document contentword/styles.xml — 样式 / Styles[Content_Types].xml| 节点 / Node | 说明 / Description |
|---|---|
<w:t> | 文本内容 / Text content |
<w:p> | 段落 / Paragraph |
<w:r> | 文本段 / Text run |
python3 scripts/docx_translate.py <docx文件路径> [--output <输出路径>]
XLSX = ZIP压缩包,内含 / ZIP archive containing:
xl/worksheets/sheet1.xml — 工作表内容 / Worksheet contentxl/sharedStrings.xml — 共享字符串表(单元格文本) / Shared strings table(cell text)xl/styles.xml — 样式 / Stylespython3 scripts/xlsx_translate.py <xlsx文件路径> [--output <输出路径>]
PDF不是XML格式,无法直接编辑文本。推荐方案 / PDF is not XML, cannot edit text directly. Recommended approach:
方案A / Method A:PDF → Word → PDF(推荐 / Recommended)
pdfplumber提取文本 → python-docx构建翻译后Word文档 → LibreOffice导出PDF
pdfplumber extract → python-docx build translated Word → LibreOffice export PDF
方案B / Method B:直接覆盖(仅文本层PDF) / Direct overlay (text-layer PDFs only) 使用 pdfplumber + pypdf2 / Using pdfplumber + pypdf2
python3 scripts/pdf_translate.py <pdf文件路径> [--output <输出路径>] [--method word|direct]
# 飞书消息附件下载(message_id 来自上下文)/ Feishu message attachment download
feishu_im_bot_image(message_id="om_xxx", file_key="file_v3_xxx", type="file")
# 返回 saved_path / Returns saved_path
# 飞书云盘文件下载 / Feishu drive file download
feishu_drive_file(action="download", file_token="xxx", output_path="/tmp/output.pptx")
方法1:消息附件发送(限制25MB)/ Method 1: Message attachment (25MB limit)
message(action="send", channel="feishu", file_path="/path/to/file.pptx", target="user:ou_xxx")
方法2:分卷发送(文件>25MB时)/ Method 2: Split send (file > 25MB)
# 分成10MB分卷 / Split into 10MB chunks
split -b 10m original.pptx part-
# 逐个发送 / Send one by one
message(action="send", file_path="part-aa", target="user:ou_xxx")
# 用户合并命令 / User merge command:
cat part-* > original.pptx
方法3:上传飞书云盘 / Method 3: Upload to Feishu Drive
feishu_drive_file(action="upload", file_path="/path/to/file.pptx", file_name="翻译版.pptx")
| 脚本 / Script | 功能 / Function | 输入 / Input | 输出 / Output |
|---|---|---|---|
pptx_translate.py | PPTX全文翻译 / Full PPTX translation | .pptx文件 | .pptx(中文版 / Chinese version) |
docx_translate.py | DOCX全文翻译 / Full DOCX translation | .docx文件 | .docx(中文版 / Chinese version) |
xlsx_translate.py | XLSX全文翻译 / Full XLSX translation | .xlsx文件 | .xlsx(中文版 / Chinese version) |
pdf_translate.py | PDF全文翻译 / Full PDF translation | .pdf文件 | .pdf(中文版 / Chinese version) |
All scripts use --output to specify output path / 所有脚本使用 --output 指定输出路径