Vkey Bid Standardizer

Automation

银行投标响应文档标准化工具(v1.0)。基于 Word 样式体系(Heading 1-5 + Normal),兼容 GB/T 9704 公文格式;统一入口 standardize.py,提供 7 条流水线(all/fix/renumber/auto-number/review/convert-md/validate-patterns)。

Install

openclaw skills install vkey-bid-standardizer

vkey-bid-standardizer

银行投标响应文档标准化工具。基于 Word 内置样式体系(Heading 1-5 + Normal),把任意 docx 一键整理为符合银行投标规范的成品稿。

核心优势

  • 章节统一:5 级编号(1. / 1.1 / 1.1.1 / 1.1.1.1 / 1.1.1.1.1)由 Word 多级列表自动渲染,杜绝编号错位
  • 手动编号自动转写:12 种常见形式(一、/(一)/第 X 章/附录 X/1.1 等)→ 跑 renumber 一键转阿拉伯层级
  • 公文格式兼容:版心、行距、字号、首行缩进严格遵循 GB/T 9704
  • 一键 3 步流水线all 子命令一气呵成——renumber → fix → auto-number
  • 可审查:每步输出报告,可 dry-run 预览改动
  • 配置驱动:22 条编号模式入 JSON 配置文件,新增模式不改代码

技能元信息

字段
技能名称vkey-bid-standardizer
行业银行
配置文件vkey_bid_standardizer/profiles/standard.json
流水线数7(all / fix / renumber / auto-number / review / convert-md / validate-patterns)
测试pytest tests/ — 61 个 case
依赖Python 3.7+ / python-docx 1.x / pytest
适用文档技术应答、商务标书、实施方案、应答偏离表、投标方案

1. 概述

1.1 编制目的

为统一银行业投标响应文档(技术应答、商务标书、实施方案等)的格式规范,满足银行招标方评标专家对版面与编号的合规审查要求,提升标书质量与中标率。

本规范遵循的基本原则(金融投标四原则):

  • 合规性:与 GB/T 9704 公文格式、银行投标规范保持一致
  • 可追溯性:5 级编号由 Word 多级列表自动生成,便于专家引用(如"详见 3.2 节")
  • 专业性:版心/字号/字体严格遵循公文标准,体现投标方严谨度
  • 可操作性:基于 Word 内置样式体系,专家可在 Word 中直接批注/修订

1.2 编制依据

序号标准编号标准名称适用要点
1GB/T 9704—2012党政机关公文格式版心/页边距/字号/行距
2GB/T 15834—2011标点符号用法标点符号全角半角
3GB/T 15835—2011出版物上数字用法数字/百分号/单位
4GB/T 9851—2008印刷字体分类字体别名识别
5JR/T 0067—2017银行信息安全风险管理指引银行业信息安全引用
6JR/T 0071—2014金融行业网络安全等级保护实施指引银行业网络安全引用

1.3 术语与定义

术语定义
样式(Style)Word 中预设的格式集合
标题样式Word 内置 Heading 1-9,标识文档层次
正文样式菜单栏显示为"正文"的 Normal 样式
行距段内行与行的垂直距离(倍数或固定值)
段前/段后段落上方/下方的空白距离
首行缩进段落首行相对左页边距的内缩
多级列表Word 的多级自动编号功能(绑定 Heading 样式)
段级覆盖段落自身 pPr(spacing/ind/jc)覆盖样式定义

2. 适用范围

2.1 适用文档类型(银行投标场景)

  • 技术应答文件:系统设计方案、技术白皮书、架构图说明、接口规范、应答偏离表
  • 商务标书:投标函、报价表、商务偏离表、资质证明、业绩清单
  • 实施方案:实施计划、项目组织、质量保证、风险控制、培训方案
  • 应答与澄清:评标答疑、技术澄清、商务澄清、补充函
  • 银行内部立项材料:总行科技部立项评审、内部方案报备、系统变更说明

2.2 不适用情形

  • 非正式的工作备忘、内部草稿、便签类文档
  • 已经按客户特定模板要求编制的对外文档(直接套用客户模板,本工具不修改)
  • 含有大量特殊排版元素(复杂公式、艺术字、流程图)的文档

3. 文档结构规范

3.1 章节层次体系

文档采用五级章节结构,编号统一带点

层级编号格式样式示例
一级章节1.Heading 11. 概述
二级章节1.1Heading 21.1 适用范围
三级章节1.1.1Heading 31.1.1 子项说明
四级章节1.1.1.1Heading 41.1.1.1 详细说明
五级章节1.1.1.1.1Heading 51.1.1.1.1 极详细

禁止:使用 一、 (一) 1 概述(无点)等其他格式。

3.2 章节编号约定

  • 标题必须用 Word 内置 Heading 样式(不能用普通段落加粗替代)
  • 编号与标题文字之间使用半角空格分隔
  • 数字编号采用阿拉伯数字,章节顺序 1, 2, 3(最多至 99)
  • 跨章节引用用完整编号(如"详见 3.2 节")
  • 金融投标章节常超 9(GB/T 9704 章条编号支持到 999),编号可至 3 位

3.3 手动编号识别

技能支持 12 种常见手动编号形式(一、(一)1.1、第 X 章、附录 X 等)→ 跑 standardize.py renumber 自动转阿拉伯层级。详见 附录 B


4. 页面布局规范

4.1 页边距

边距标准值允许偏差
3.7 厘米±0.1 厘米
3.5 厘米±0.1 厘米
2.8 厘米±0.1 厘米
2.6 厘米±0.1 厘米

4.2 纸张与方向

  • 纸张规格:A4(21 厘米 × 29.7 厘米)
  • 页面方向:纵向
  • 特殊场景:表格超宽时可用横向

5. 字体与字号规范

5.1 字体配置

元素西文字体中文字体适用
标题Times New Roman黑体标题 1-5
正文FangSong仿宋Normal 段落
表头Times New Roman黑体表格首行
表内FangSong仿宋表格数据

5.2 字号标准(GB/T 9704 公文格式)

元素字号磅数标识
正文四号14ptNormal
一级标题小二号18ptHeading 1
二级标题三号16ptHeading 2
三级标题小三号15ptHeading 3
四级标题四号14ptHeading 4
五级标题五号10.5ptHeading 5
表格表头五号10.5pt
表格内容五号10.5pt
页脚五号10.5pt

5.3 颜色

  • 标题与正文:黑色(#000000
  • 强调用粗体/下划线,避免颜色(除确有需要)
  • 所有颜色保证黑白打印清晰

6. 段落与间距规范

6.1 行距

元素类型
正文固定值20 磅
标题 1-5倍数1.25 倍

6.2 段落间距

元素段前段后
一级标题16 磅0 磅
二级标题14 磅0 磅
三级标题12 磅0 磅
四级标题10 磅0 磅
五级标题8 磅0 磅
正文0 磅0 磅

6.3 缩进与对齐

  • 首行缩进:正文段落 2 字符 = 2 × 字号 = 28 磅(4 号字 14pt × 2)
  • 对齐:左对齐(避免两端对齐的字间距不均)

OOXML w:ind 字段单位(必须严格区分,否则 Word 显示与渲染不一致):

字段单位2 字符示例说明
w:firstLine1/20 pt(twips)56028pt = 560 twips;用于渲染
w:firstLineChars1/100 字符2002 字符必须写 200,不是 2;用于对话框"度量值"显示
w:left1/20 pt(twips)0段落左缩进
w:leftChars1/100 字符0段落左缩进(字符单位)
w:hanging / w:hangingChars同上悬挂缩进

常见陷阱:python-docx 设 Pt(22.4)只写 w:firstLine 为 twips 值,不写 w:firstLineChars;Word 对话框"度量值"读 firstLineChars 显示为字符数,缺省时显示 0/1 字符。apply_paragraph_format 必须同时写两字段并保持换算一致firstLineChars = first_line_chars × 100)。

  • 标题不缩进,左对齐于页边距

7. 表格规范

元素字体字号对齐
表头黑体10.5pt居中
表内仿宋10.5pt左对齐

边框:外框 1.5 磅、内框 0.5 磅、黑色 #000000
表头底纹:浅灰 #D9D9D9(仅首行)
列宽:自动列宽,按内容比例分配

7.1 表格段落缩进(强制要求)

  • 表格内段落不得继承正文 Normal 样式的首行缩进(GB/T 9704 公文规范不要求表格内容缩进)
  • 必须在每个 w:tc > w:p 的段级 w:pPr 强制写入 w:ind,阻断样式继承链:
<w:pPr>
  <w:ind w:firstLine="0" w:firstLineChars="0"/>
</w:pPr>

陷阱:仅 del 现有 w:firstLine 属性无法阻断"无 w:ind 元素"的段落(会继承 Normal 样式)。必须 get_or_add_pPr() + get_or_add_w:ind() 显式构造——对应 pipeline.py::_fix_tables 中"强制段级 firstLine=0"逻辑。


8. 页脚规范

金融投标页脚默认居中页码,可按需扩展为「项目编号 + 页码」或「招标编号 + 页码 + 总页数」。

属性标准值
字体仿宋 10.5 磅(五号)
对齐居中
位置页底
起始页码1
格式页码(默认)/ 项目编号 - 页码(可配)

模板与 standard.json::footer.text 字段联动。如需 项目编号-页码 格式,编辑 footer.text{project_code} - {page}(v1.0 占位符占位,v1.1 将完整支持)。


9. 使用指南

9.1 推荐入口

v1.0 唯一 CLI 入口是顶层 standardize.py

# 全流水线(推荐)
python standardize.py all input.docx -o output.docx

# 单步
python standardize.py fix input.docx
python standardize.py renumber input.docx
python standardize.py auto-number input.docx
python standardize.py review input.docx
python standardize.py convert-md input.md
python standardize.py validate-patterns

通用 flag:--profile standard(默认;bid 是别名)/ --dry-run / --backup / -v / -o

9.2 流水线总览

#名称命令作用
1全流水线standardize.py allrenumber → fix → auto-number 三步串行
2修复样式standardize.py fix应用规范 + 清段级/run 级覆盖
3重编号standardize.py renumber手动编号(一、/(一)/1.1)→ 阿拉伯层级
4自动编号standardize.py auto-numberHeading 1-5 绑 Word 多级列表
5审查standardize.py reviewJSON 审计报告(段级覆盖、issues)
6MD→docxstandardize.py convert-md从 Markdown 源生成
7模式校验standardize.py validate-patterns22 条模式样本测试

9.3 典型应用场景

场景一:技术应答文件标准化

python standardize.py all 银行核心系统技术应答_v1.0.docx -o 银行核心系统技术应答_v1.0_标准化.docx

跑完 3 步:手动编号(一、/(一)/1.1)→ 阿拉伯层级 → 套用 GB/T 9704 公文样式 → 绑 Word 多级列表。

场景二:先 dry-run 看会改什么,不写文件

python standardize.py all 银行核心系统技术应答_v1.0.docx --dry-run

只输出计划(如 renumber (62) | fix (1756) | auto-number (5)),不写任何文件——评标前安全预览改动。

场景三:投标合规审查

python standardize.py review 银行核心系统技术应答_v1.0_标准化.docx

输出 JSON 报告:overrides 全为 0 + issues: [] 即符合公文规范。

场景四:备份原文件再修复(防止覆盖)

python standardize.py all 银行核心系统技术应答_v1.0.docx -o 银行核心系统技术应答_v1.0_标准化.docx --backup

自动把原文件备份为 银行核心系统技术应答_v1.0.docx.bak

场景五:从 Markdown 起草金融投标稿

python standardize.py convert-md 银行核心系统技术应答.md -o 银行核心系统技术应答_v1.0.docx

按附录 C 的 Markdown 规范写,5 级章节 + 表格 + 段落直接转成标准 docx。


10. 质量保证

10.1 审查清单

维度通过标准
样式使用标题用 Heading 1-5,正文用 Normal
字体标题黑体,正文仿宋,色 #000000
间距行距 1.25 倍 / 固定 20 磅;段前段后符合规范
表格表头黑体 10.5pt 灰底,表内仿宋 10.5pt
页脚仅页码数字
编号标题具备 1./1.1/1.1.1 层级
段级覆盖所有 Heading/Normal 段落无 pPr 覆盖(overrides 全为 0)

10.2 合规判定

  • 完全合规issues 空 + overrides 全 0
  • 基本合规:仅有模式 warning(需手动添加未识别编号)
  • 不合规:存在段级覆盖或样式错乱,跑 standardize.py fix 修复

11. 配置管理

11.1 配置文件

规范通过 vkey_bid_standardizer/profiles/standard.json 集中管理,含 9 个节:

作用金融投标关注点
page页面边距GB/T 9704 版心 156×225mm
body正文样式三号仿宋 + 28 磅固定行距
headings5 级标题样式黑体 + 1.5 倍行距
tables表格样式 + 边框灰底表头 + 1.5/0.5 磅框
footer页脚配置居中页码 / 项目编号-页码
numberingWord 多级列表1./1.1/1.1.1 层级
patterns22 条手动编号识别中文 / 第X章 / 附录
color颜色(#000000黑白打印兼容
metadata(v1.1)项目元数据招标编号 / 项目名称 / 投标类型

bid.jsonstandard.json 的别名(找不到时自动 fallback)。调整规范standard.json 而非源代码。

11.2 模板文件

模板路径用途
标书空白模板templates/bid_blank.mdMarkdown 金融投标起草(convert-md 输入源)

11.3 依赖

  • Python 3.7+
  • python-docx 1.x(pip install python-docx
  • Word 2016+ / WPS Office 2019+

12. 系统要求

组件最低版本备注
Python3.7+推荐 3.10+
python-docx1.0+pip install python-docx
pytest7.0+仅运行测试时需要
Microsoft Word2016+需支持多级列表
WPS Office2019+兼容多级列表

安装依赖

pip install python-docx pytest

13. 自定义模式教程

13.1 何时需要

如果客户 docx 用了非标准编号形式(不在 12 种内置模式里),renumber 会输出 warning:

[Heading 3] 未识别编号: §3.1 系统架构

13.2 添加步骤

Step 1:分析样本

从 docx 复制一段未识别的标题,如 §3.1 系统架构

Step 2:写正则,加到 standard.json::patterns::h3

{
  "name": "section_sign",
  "pattern": "^§(\\d+)\\.(\\d+)\\s+(.*)$"
}

pattern 规则:第一个捕获组必须是编号

Step 3:标注解析模式

如果编号含中文数字,加 "cn_to_int": true

{
  "name": "part_cn",
  "pattern": "^第([一二三四五六七八九十百]+)部分\\s+(.*)$",
  "cn_to_int": true
}

或混合(中/阿):"mixed_cn_int": true

Step 4:模式顺序

更具体的模式放前面(避免被通用模式抢先匹配)。例如 wps_label 必须在 single_arabic 之前。

Step 5:验证

python standardize.py validate-patterns

如样本测试不通过,输出会指明问题。

13.3 字段参考

字段必填说明
name模式名(英文,warning 输出用)
pattern正则,第一个捕获组必须是编号
cn_to_int第一组是中文数字(用 parse_cn_num
mixed_cn_int第一组是混合数字(1

14. 修订历史

版本日期修订人内容
V1.02026-06-03vkey-bid-standardizer首次独立发布;统一入口 standardize.py;7 条流水线;22 条编号模式;61 个 pytest case;单一真相源 standard.json
V1.0.12026-06-04vkey-bid-standardizer修复 3 项 OOXML 规范偏差:① firstLineChars 单位误用(改 ×100);② firstLine 增补 twips 兜底(28pt = 560);③ 表格段落强制段级 firstLine=0 阻断 Normal 样式继承

附录 A 配置文件

vkey_bid_standardizer/profiles/standard.json 是规范的唯一真相源

完整结构(请直接读源文件):

# 查看完整 JSON
cat vkey_bid_standardizer/profiles/standard.json

# 关键字段速查
python -c "from vkey_bid_standardizer import load_profile; p = load_profile('standard'); print(p['headings'])"

不要在 SKILL.md 里复制完整 JSON——配置可能演化,文档与代码脱钩后维护成本高。

附录 B 编号模式清单

standard.json::patterns22 条正则规则,覆盖 12 种常见多级编号形式。

模式名层级形式示例
chinese_punctH1一、 二、一、概述
chapter_cnH1第X章(中文)第十章 总则
chapter_arabicH1第N章第3章 术语
appendix_cnH1附录X附录A 数据
appendix_alphaH1Appendix XAppendix A Data
single_arabicH1-H51. 2.1. 总则
circle_numH1①②③① 条款
cn_paren_bothH2(一)(一)(一)适用范围
section_cnH2第X节第一节 概述
dot_arabicH21.11.1 范围
wps_labelH2/H31. 标题 11. 标题 1
arabic_parenH3-H5(1)(1)(1)数据采集
article_cnH3第X条第一条 范围
dot_tripleH31.1.11.1.1 概述
dot_quadH41.1.1.11.1.1.1 详细
dot_quintH51.1.1.1.11.1.1.1.1 极详细

模式顺序很重要——更具体的模式放前面(避免被通用模式抢先匹配)。
失败降级:未匹配段落原样保留 + warning。

正则源在 standard.json::patterns不要在 SKILL.md 里复制正则——配置可能演化。

附录 C Markdown 编写规范

适用于 standardize.py convert-md 流水线的 Markdown 源文件。

约定

  • # 文档标题 仅用于首行大标题(居中加粗、黑体 18pt),独立成段,不进入目录
  • ## 1. 章节名 才是正文章节起点(对应 Heading 1)
  • 不要省略文档标题——脚本按 Markdown 层级顺序解析
Markdown 语法Word 样式
# 文档标题Normal 段落(居中加粗,黑体 18pt)
## 1. 章节名Heading 1
### 1.1 子章节Heading 2
#### 1.1.1 三级Heading 3
##### 1.1.1.1 四级子项Heading 4(独立成行)
###### 1.1.1.1.1 五级子项Heading 5(独立成行)
| 表头 |表格(1.5pt 外框 + 0.5pt 内框)

要求:标题独立成行 / 表格用标准 Markdown / 不使用代码块 / 列表项末尾加句号。