古言 - 中文极简压缩模式
v1.1.0古言模式 - 极简中文压缩技能。模拟文言文/成语的压缩逻辑,将日常对话压缩至最短表达,同时保留可理解性和情绪色彩。触发场景:(1) 用户要求"古言"、"极简中文"、"压缩对话";(2) 需要对记忆文件/长文本进行精简时;(3) 上下文已清楚时。核心原理:单字代词、成语替代表达、删虚词助词、疑问词压缩。
古言 - 中文极简压缩模式
核心原则
优先最高压缩(L3),降级仅在歧义出现时触发。
L3(文言压缩)→ L2(成语压缩)→ L1(微压)→ 白话(保留)
↑ 仅歧义无法消解时,逐级向下
压缩层级
L3 文言压缩(首选,默认)
单字能达意则单字,适用:记忆文件、技术记录、日常对话。
单字词库:
| 白话 | 文言单字 |
|---|---|
| 吃饭 | 食 |
| 回家 | 归 |
| 不知道 | 未知/罔 |
| 为什么 | 何/缘何 |
| 看情况 | 视情 |
| 可能 | 或许/恐 |
| 算了 | 罢 |
| 没有 | 无 |
| 有 | 有/存 |
| 很好 | 善 |
| 不行 | 否 |
| 这样做 | 如此/斯 |
| 怎么办 | 何为 |
| 我 | 吾 |
| 你 | 汝/尔 |
| 他 | 其 |
| 这 | 此/兹 |
| 那 | 其/彼 |
| 什么 | 何 |
| 怎么 | 咋/何 |
| 为什么 | 缘何/何故 |
| 走/去 | 赴/往 |
| 可以 | 可/许 |
| 对/是 | 然/善 |
| 吗 | 否 |
极简句式:
- 真的?→ 然否?
- 不知道 → 未知
- 随便 → 随/任
- 走吧 → 行/往
- 好 → 善/可/诺
- 不行 → 否
- 为什么 → 缘何
- 怎么样了 → 何如
- 怎么办 → 何为
技术词处理(不强行古文化):
全保留(不压):OEE / API / SQL / JSON / GitHub / URL
半压(可用古语替换):设备综合效率→机效;持续改善→改善;维修→修
L2 成语压缩(次选)
用四字格替代表达,比例:12-20字 → 4字:
| 冗长表达 | 成语压缩 |
|---|---|
| 表面上答应,实际不做 | 阳奉阴违 |
| 事情已经无法挽回 | 木已成舟 |
| 自己心里明白不用说 | 冷暖自知 |
| 说话容易做事难 | 光说不练 |
| 情况每天都在变 | 日新月异 |
| 表面上很厉害实际不行 | 外强中干 |
| 越考虑越难决定 | 瞻前顾后 |
| 各有各的道理 | 各执一词 |
| 从头开始重新做 | 另起炉灶 |
| 一步一步做 | 循序渐进 |
| 表面光鲜内里空虚 | 金玉其外 |
| 事情越来越糟 | 江河日下 |
| 同时做多件事 | 多线并行 |
| 抓住核心关键 | 擒贼擒王 |
| 很快就失败 | 昙花一现 |
L1 微压(降级保底)
仅在L3/L2产生歧义时启用,删虚词但保留基本可读性。
- 删除助词:的、了、着、吗、呢、啊、呀、吧
- 删除重复主语(上下文已知则省略)
- 删除连接词:因为、所以、然后、接着、然而
歧义判断标准:
- 同一单字有两个以上合理解读
- 省略主语后第三方无法还原句意
- 技术参数、型号等精确内容
白话(最终保底)
当前述压缩全部产生歧义时,输出标准白话,不强行压缩。
歧义消解表(L3→L1 降级判断依据)
| 歧义词 | 场景 | 优先义 | 替换词(升L2) |
|---|---|---|---|
| 行 | 设备/动作 | 行走 | 赴/往 |
| 行 | 允许 | 可以 | 可/许 |
| 行 | 肯定 | 对 | 然 |
| 赴 | 方向 | 前往 | 往 |
| 许 | 允许 | 可以 | 可 |
| 许 | 数量 | 约 | 约 |
| 善 | 良好 | 好 | 可/诺 |
| 善 | 擅长 | 长于 | 擅 |
| 否 | 否定 | 不 | 不 |
| 否 | 疑问 | 吗 | 否 |
| 然 | 肯定 | 对 | 善/可 |
| 然 | 连词 | 但是 | 然 |
| 任 | 随便 | 随 | 任/随 |
| 任 | 职责 | 责 | 责 |
压缩流程(实操)
- 读句 → 提取核心谓语+宾语
- 优先L3 → 查单字词库,能压则压
- 歧义检测 → 有歧义查消解表,有替换词则用L2替换词
- 无解降级 → L3→L2→L1→白话,逐级降
- 字数检查 → 目标12字以内(L3)
标点策略
| 符号 | 策略 |
|---|---|
| 句号 | 句号「。」 |
| 问号 | 问号「?」 |
| 感叹 | 感叹「!」 |
| 顿号 | 顿号「、」 |
| 分号 | 分号「;」 |
| 逗号 | 逗号「,」 |
| 引号 | 书名号「》」或引号「「」」 |
记忆文件压缩示例
压缩前:
## 2026-04-22 古言技能优化
### 问题
- 歧义:单字多义无法消解
- 技术词断裂:OEE等混入破坏语感
- 过长句:超25字无切分规则
- 标点:白话标点与古言冲突
- 降级混乱:无明确降级机制
### 优化方向
- L3优先,降级仅在歧义时触发
- 技术词分层处理
- 建立歧义消解表
- 超长句切分规则
- 标点规范化
压缩后(L3):
2026-04-22 古言优化
问题:歧义未消;技词断裂;句过长;标点乱;降级无据
优化:L3优先;技词分三层;建消解表;句切分;标规范化
触发与退出
触发: 说"古言"、"极简"、"压缩"
退出: 说"正常"、"标准" → 恢复标准中文
避坑原则
过压标志(须降级):
- 歧义出现且无替换词
- 省略主语后第三方无法还原
- 技术参数精确性受损
欠压缩标志(可再压):
- 句中仍有虚词助词
- 可用单字替代词未替换
- 可用成语未替换
参考文献
详细成语词库 → references/chengyu.md
文言单字词库 → references/wenyan.md
Version tags
latest
