古言 - 中文极简压缩模式

v1.1.0

古言模式 - 极简中文压缩技能。模拟文言文/成语的压缩逻辑,将日常对话压缩至最短表达,同时保留可理解性和情绪色彩。触发场景:(1) 用户要求"古言"、"极简中文"、"压缩对话";(2) 需要对记忆文件/长文本进行精简时;(3) 上下文已清楚时。核心原理:单字代词、成语替代表达、删虚词助词、疑问词压缩。

0· 82· 1 versions· 0 current· 0 all-time· Updated 6d ago· MIT-0

古言 - 中文极简压缩模式

核心原则

优先最高压缩(L3),降级仅在歧义出现时触发。

L3(文言压缩)→ L2(成语压缩)→ L1(微压)→ 白话(保留)
   ↑ 仅歧义无法消解时,逐级向下

压缩层级

L3 文言压缩(首选,默认)

单字能达意则单字,适用:记忆文件、技术记录、日常对话。

单字词库:

白话文言单字
吃饭
回家
不知道未知/罔
为什么何/缘何
看情况视情
可能或许/恐
算了
没有
有/存
很好
不行
这样做如此/斯
怎么办何为
汝/尔
此/兹
其/彼
什么
怎么咋/何
为什么缘何/何故
走/去赴/往
可以可/许
对/是然/善

极简句式:

  • 真的?→ 然否?
  • 不知道 → 未知
  • 随便 → 随/任
  • 走吧 → 行/往
  • 好 → 善/可/诺
  • 不行 → 否
  • 为什么 → 缘何
  • 怎么样了 → 何如
  • 怎么办 → 何为

技术词处理(不强行古文化):

全保留(不压):OEE / API / SQL / JSON / GitHub / URL
半压(可用古语替换):设备综合效率→机效;持续改善→改善;维修→修

L2 成语压缩(次选)

用四字格替代表达,比例:12-20字 → 4字:

冗长表达成语压缩
表面上答应,实际不做阳奉阴违
事情已经无法挽回木已成舟
自己心里明白不用说冷暖自知
说话容易做事难光说不练
情况每天都在变日新月异
表面上很厉害实际不行外强中干
越考虑越难决定瞻前顾后
各有各的道理各执一词
从头开始重新做另起炉灶
一步一步做循序渐进
表面光鲜内里空虚金玉其外
事情越来越糟江河日下
同时做多件事多线并行
抓住核心关键擒贼擒王
很快就失败昙花一现

L1 微压(降级保底)

仅在L3/L2产生歧义时启用,删虚词但保留基本可读性。

  • 删除助词:的、了、着、吗、呢、啊、呀、吧
  • 删除重复主语(上下文已知则省略)
  • 删除连接词:因为、所以、然后、接着、然而

歧义判断标准:

  • 同一单字有两个以上合理解读
  • 省略主语后第三方无法还原句意
  • 技术参数、型号等精确内容

白话(最终保底)

当前述压缩全部产生歧义时,输出标准白话,不强行压缩。


歧义消解表(L3→L1 降级判断依据)

歧义词场景优先义替换词(升L2)
设备/动作行走赴/往
允许可以可/许
肯定
方向前往
允许可以
数量
良好可/诺
擅长长于
否定
疑问
肯定善/可
连词但是
随便任/随
职责

压缩流程(实操)

  1. 读句 → 提取核心谓语+宾语
  2. 优先L3 → 查单字词库,能压则压
  3. 歧义检测 → 有歧义查消解表,有替换词则用L2替换词
  4. 无解降级 → L3→L2→L1→白话,逐级降
  5. 字数检查 → 目标12字以内(L3)

标点策略

符号策略
句号句号「。」
问号问号「?」
感叹感叹「!」
顿号顿号「、」
分号分号「;」
逗号逗号「,」
引号书名号「》」或引号「「」」

记忆文件压缩示例

压缩前:

## 2026-04-22 古言技能优化

### 问题
- 歧义:单字多义无法消解
- 技术词断裂:OEE等混入破坏语感
- 过长句:超25字无切分规则
- 标点:白话标点与古言冲突
- 降级混乱:无明确降级机制

### 优化方向
- L3优先,降级仅在歧义时触发
- 技术词分层处理
- 建立歧义消解表
- 超长句切分规则
- 标点规范化

压缩后(L3):

2026-04-22 古言优化
问题:歧义未消;技词断裂;句过长;标点乱;降级无据
优化:L3优先;技词分三层;建消解表;句切分;标规范化

触发与退出

触发: 说"古言"、"极简"、"压缩"
退出: 说"正常"、"标准" → 恢复标准中文


避坑原则

过压标志(须降级):

  • 歧义出现且无替换词
  • 省略主语后第三方无法还原
  • 技术参数精确性受损

欠压缩标志(可再压):

  • 句中仍有虚词助词
  • 可用单字替代词未替换
  • 可用成语未替换

参考文献

详细成语词库 → references/chengyu.md
文言单字词库 → references/wenyan.md

Version tags

latestvk97281ns4h5efnvqspawjhxcfx85bc1y