腾讯文档链接解析归档

Other

腾讯文档链接解析、下载、归档入库。当用户输入包含 docs.qq.com 链接的文本,自动提取腾讯文档链接→逐个导出下载→保存至桌面/腾讯文档/目录→更新Excel台账。触发词:下载腾讯文档、归档腾讯文档、保存腾讯文档、备份腾讯文档、批量下载腾讯文档、解析腾讯文档链接。只处理 docs.qq.com 域名链接,忽略其他外链。

Install

openclaw skills install tencent-doc-link-archiver

腾讯文档链接解析、下载、归档入库

流水线总览

用户输入文本 → 识别过滤腾讯文档链接 → 逐个导出下载 → 写入归档Excel台账 → 输出反馈报告。严格分步执行,不可跳步。


步骤1:识别过滤腾讯文档链接

  1. 从用户输入全文提取全部 http/https 链接(正则:https?://[^\s<>"')】]+
  2. 筛选域名匹配 docs.qq.com 的链接,剔除其他外链
  3. 若无有效腾讯文档链接,立刻回复"未识别到任何腾讯文档链接",终止任务
  4. 输出提取清单:本次待下载腾讯文档链接列表

步骤2:文件存储路径

  • 根目录:桌面/腾讯文档/(即 $env:USERPROFILE\Desktop\腾讯文档\
  • 不存在则自动创建
  • 文件命名:YYYYMMDD_原文档名称.后缀(后缀随原文档类型:docx/xlsx/pptx/pdf等)

步骤3:逐个下载腾讯文档

3.1 下载能力优先级

优先调用可用能力:腾讯文档 MCP(mcporter)> 腾讯文档 API > CLI 工具

使用 mcporter 下载流程:

  1. 通过 mcporter 搜索或直接访问文档,获取 file_id
  2. 调用 mcporter 的导出/下载功能获取文件
  3. 保存至指定路径,套用 YYYYMMDD 日期前缀命名

3.2 下载规则

  • 对每条 docs.qq.com 链接串行逐个处理,不并发
  • 下载保存至 桌面/腾讯文档/,严格套用命名规则
  • 单条下载失败记录失败原因,不中断整体批量任务
  • 每条下载完成标记:链接 → 保存文件名

3.3 获取文档名称与类型

通过 mcporter 读取文档信息获取标题和文件类型;若无法获取,从 URL 或页面标题推断。

步骤4:写入归档Excel台账

  • 位置:桌面/腾讯文档/腾讯文档链接台账.xlsx
  • 固定两列:A列=下载日期(YYYYMMDD),B列=完整腾讯文档链接
  • 已有表格则追加新行,不覆盖历史数据
  • 首次生成自动创建表头

使用 openpyxl 操作 Excel(脚本见 scripts/update_ledger.py)。


输出反馈模板

执行完毕后,按以下格式输出:

📋 归档报告
- 提取到有效链接:X 条
- 成功下载:
  ✅ YYYYMMDD_文档名.docx
  ✅ YYYYMMDD_文档名.xlsx
- 下载失败(如有):
  ❌ 链接 → 失败原因
- 台账已更新至:桌面/腾讯文档/腾讯文档链接台账.xlsx

约束规则

  1. 只处理 docs.qq.com 腾讯文档,微信/企业微信/外部网页链接全部忽略
  2. 日期统一 YYYYMMDD 格式(取系统当前日期)
  3. 所有文件、Excel台账统一存放在 桌面/腾讯文档/ 目录
  4. 批量多条链接串行依次处理,不并发乱序
  5. 权限不足、接口限流、文档无导出权限时如实标注失败,不崩溃终止
  6. 全程不篡改链接、不修改原文档内容,仅做下载归档与台账记录