Install
openclaw skills install @tinglan803-coder/document-html-image-semantic-namingopenclaw skills install @tinglan803-coder/document-html-image-semantic-naming这是一套针对 doc / docx / pdf -> html 场景的图片命名与引用整理方法。核心不是“把图片导出来”,而是把图片从无语义的 image1.jpg、media/image3.png,变成后续一眼可选、一眼可懂、可长期复用的资产。
当用户出现以下需求时,立即使用本技能:
image1/image2 没法看,按内容重命名一下”文档型图片的语义,通常不在原文件名里,而在“它在文档中被如何引用”这件事里。
因此,图片命名必须来自两类信息的联合判断:
引用上下文
图片自身内容
出现以下任一信号,说明不能直接沿用导出文件名:
image1、image2、media/image3 这类通用名media/、assets/、tmp/ 等导出目录命名时按以下优先级取信息:
[地点或模块]-[场景语义]-[横竖版]-[序号].jpg
示例:
西湾山-四湾连珠全景-横图-01.jpg浪茄沙滩-果冻海岸-横图-02.jpg西贡老街-市井烟火补给-横图-01.jpg行程说明-集合地点示意-截图-01.png酒店介绍-大堂空间氛围-横图-01.jpg使用“模块名 + 画面语义”命名,而不是继续保留 image3:
开篇主题-山海意境-横图-01.jpg产品亮点-亲子互动场景-横图-02.jpg须知说明-证件示意-截图-01.png先建立最基础的关系表:
原始图片文件 -> HTML 中引用位置 -> 所在段落/标题/模块
至少要知道每张图:
<img> 引用每张图至少归入以下一种角色:
如果上下文与图片画面一致,直接用上下文命名。
如果上下文过泛,例如:
则必须看图片内容补上关键信息,如:
执行时必须同步完成三件事:
src每次必做:
img src 是否都能在磁盘上找到image1、media/image2 这类无语义引用media/image1.png零散根目录-横图-01如果后续还要进入 travel-material-preprocess:
否则会因为原始文件名无信息,导致输出落入 零散根目录,文件名仍然不可用。
image1/image2图片1-横图-01.jpg 这类伪语义命名完成后至少应产出:
source,image_context,final_name
image4.jpeg,西湾山段落后配图,西湾山-四湾连珠全景-横图-01.jpg
image9.jpeg,西贡老街补给段落后配图,西贡老街-市井烟火补给-横图-01.jpg
完成后应明确告诉用户:
这项技能的本质不是“批量改文件名”,而是把文档内的隐式图文关系,转成可复用的显式素材语义。
只要后续还涉及:
这一步都非常值。