De-AI Polish

Other

检测并去除文章中的AI化表述模式。**必须触发**:当文章经过写作流程(无论是模式1润色优化还是模式2内容创作)完成初稿后,在输出给用户之前,**必须**调用此 skill 进行 AI腔 检测和去除。不可跳过此步骤,不可仅凭感觉省略检测。任何"先输出再说"的做法都是不允许的。

Install

openclaw skills install de-ai-polish

De AI Polish

快速开始

检测文章中的AI化表述:

# 全文扫描检测
/de-ai-polish detect @article.md

# 直接修改
/de-ai-polish fix @article.md

核心检测规则

总则:检测原则与通用模式

核心原则:以下清单和规则是参考框架,不是穷举清单。AI 写作的变体无穷,正则匹配必然遗漏。检测必须以 Agent 通读全文为主,清单仅作为辅助参考。

AI化表述往往以变体出现,不会恰好匹配清单字面形式。遵循以下原则:

  1. 向上溯源:未列出的表述判断是否属于已知模板家族的变体(对比句式→递进结构→程式化转折→工整排比→程度副词堆叠→否定宣言→分离式对比→同义循环)
  2. 频次红线:以下词/结构在全文出现超2次即视为AI程式化:越来越/越...越...其实往往/通常/很多时候经常/常常更重要的是/更麻烦的是看起来/看来真正不只/不只是更像/更像一个/更像一种很容易更容易
  3. 连续重复:同一强化词在相邻句子连续出现即为AI痕迹(才...才...不是...而是...就是X,就是Y,就是Z
  4. 结构机械感:三个以上并列项以相同虚词引导(容易X、容易Y、容易Z);句子开头用程式化引导词(更麻烦的是说到这里);程度副词+抽象名词固定搭配(有很强的体感
  5. 同义循环:不同词反复表达同一语义场,如窄/小/平/浅/局限变化/改变/转变/变革,在短距离内超过3次即为AI词汇贫乏的表现

一、绝对禁止类(必须去除)

以下模式在任何情况下都应去除,它们是最明显的AI痕迹:

1. 对比句式

必须去除的模式

  • 不是.*而是
  • 并非.*而是
  • 不在于.*在于
  • 不在.*而在(缩写形式,如「问题不在工具,而在…」)
  • 不再是.*而是
  • 与.*是两回事
  • 与.*不等同于
  • 看似.*实则(如:看似在讲隐喻,实则在讲生产方式)
  • 看起来.*其实(如:看起来是X,其实是Y)
  • 可以.*但不能.*(能力限定式对比,如"冷水可以让人清醒,但不能替人看见未来")
  • 不在于.*也不在于(双重否定变体)
  • 远不只是.*("不只是"的加强变体)
  • 这不是X。这是Y。(分离式对比:把「不是…而是」拆成两句,本质相同)
  • 这不是X(否定宣言:作为段落开头或独立断言,如「这不是想象」「这不是追热点」)
  • **这是X**(肯定宣言:作为独立加粗行或引用块,本质与否定宣言相同,只是省略了否定前缀,如「这是提前移动自己的观察位置」「这是在新的信任机制里,为自己建立位置」)
  • 低水平X...高水平Y / 表层X...深层Y(工整对称对比,常出现在引用块中)

改写策略:根据上下文选择「删 / 合并 / 改写」。拆成独立陈述句或递进关系,避免为了强调而强行对比。改写时不要套用同一结构("本质上是X""症结在于X"),要根据语境灵活选择陈述、问答、因果、并列等替代方式。

否定宣言和肯定宣言的改写:直接删除"这不是"或"这是"前缀,保留核心内容即可。加粗行本身的格式已足够传达强调,无需再用"这是"开头。

同义词循环

检测模式:在短距离内使用多个同义词指代同一事物

示例

  • 主人公…主要角色…中心人物…英雄(同一段落中用4个词指代同一人)
  • 系统…平台…工具…解决方案(频繁换词但指代同一事物)

改写:统一使用最准确的词汇,在上下文清晰的情况下重复使用同一词汇。

2. 程式化连接词

写作规则中已禁用

  • 首先其次此外但是因此然而
  • 一方面另一方面
  • 综上所述总而言之

AI 词汇库

  • 深入探讨深入分析(过度使用)
  • 强调凸显彰显(过度重复)
  • 持久的持久的证明
  • 增强增强其
  • 培养培养/促进促进
  • 获得获得.*的认可
  • 相互作用复杂的相互作用
  • 复杂/复杂性错综复杂的
  • 格局整体格局格局的演变(抽象名词滥用)
  • 织锦社会织锦(抽象名词滥用)
  • 宝贵的宝贵的经验
  • 充满活力的充满活力的社区

肤浅分析表述

  • 突出/强调/彰显…,确保…
  • 反映/象征…,为…做出贡献
  • 培养/促进…,涵盖…
  • 展示…,体现…

3. 结尾姿态句

必须检测的表述

  • 方向已经明确
  • 未来可期
  • 拭目以待
  • 这只是开始
  • 让我们期待

公式化展望

检测关键词

  • 尽管其…面临若干挑战…
  • 尽管存在这些挑战尽管面临挑战
  • 挑战与遗产机遇与挑战并存
  • 未来展望下一步计划
  • 我们将继续关注值得关注

改写:删除空洞的展望,用具体事实或具体计划结尾,或直接结束。

4. 口语化与随意表述

必须检测的词汇

  • 挺稳很稳靠谱
  • 摇摆不稳
  • 搞定没问题
  • 迟早得肯定必须得
  • 过度使用肯定词:肯定绝对一定
  • 跑偏很顺挺顺等过于口语化的状态描述

随意化表述模式

  • 写长了做多了搞定了等过于随意的说法
  • 迟早得拆肯定会必须得等口语化表达
  • 接下来要盯的东西接下来要关注的等口语化表达
  • 用简短口语替代专业说明

改写方向:使用更正式、更具体的表达("迟早得拆"→"需要考虑拆分","跑偏"→"偏离预期","很顺"→"顺畅")。

系动词回避

  • 作为/代表/标志着/充当 [一个]拥有/设有/提供 [一个]位于.*的中心坐落于
  • 改写:"作为X的Y"→"X是Y","设有Z个W"→"有Z个W","坐落于"→"位于"

谄媚语气

  • 好问题!您说得完全正确!这就是一个很好的观点
  • 改写:直接陈述核心内容,删除讨好性表达。

5. 绝对化、哲学化与戏剧化表述

必须检测的表述

  • 并不是一个绝对命题
  • 本质上从根本上说从本质上讲
  • 必然无疑绝对必须
  • 真正的核心的关键的(过度使用)
  • 推到底刺痛感
  • 这词听着玄道理其实很朴素
  • 天然天生自然而然(绝对化自然表述)
  • 立刻马上立即(过于绝对的时间表述)
  • 其实(过度使用,显得矫饰)
  • 其实已经能看清其实很简单等带"其实"的表述
  • 很现实(AI式绝对化判断)

过度强调意义

  • 作为.*的体现/证明/提醒充当.*的证明
  • 标志着.*关键时刻见证了.*历史
  • 是.*不可或缺的组成部分是.*的重要体现
  • 凸显/强调/彰显了其重要性/意义
  • 反映了更广泛的象征着其持续的/永恒的/持久的
  • 为.*做出贡献为.*奠定基础
  • 关键转折点不断演变的格局

虚假范围

  • 从.*到.*(检查是否在有意义的尺度上)
  • 例如:"从大爆炸到暗物质"这种无意义的大范围
  • 问题:强行用"从X到Y"结构,但X和Y不在同一尺度上

程度副词堆叠结构

  • 很+形容词/动词:很直接、很吃人、很依赖、很麻烦
  • 非常+形容词/动词:非常依赖、非常麻烦、非常清楚
  • 有+很+的+名词:有很直接的感觉、有很强的体感、有很深的感受
  • 改写:用更精确的动词替代程度副词,或直接陈述具体状态

戏剧化感受词

  • 震动、震撼、触动、眼前一亮、引人入胜、令人振奋
  • 改写:换成更平实的表述("有意思"、"不一样"、"值得注意")

改写:用弹性表达替代绝对化("必然"→"往往"/"多半"/"可能","本质上"→"通常"/"在某种程度")。保留空间感,不过度封死结论。

6. 工整排比与对称结构

必须检测的结构

  • 三个或以上的"既要...又要...还要..."排比
  • 强行对仗的并列句式
  • 工整的对称表达结构

具体示例

  • "既要说明'我是谁',又要说明'我在做什么',还要说明'我怎么做'"
  • "讲清楚口味、讲清楚底线、讲清楚习惯"(三个"讲清楚")
  • 过于工整的"一方面...另一方面..."

疑问词排比

三个以上疑问词引导的并列项,是 AI 列举场景时的典型结构:

  • 能不能...能不能...能不能...(如"能不能下载,能不能直接跑,能不能少填几张表")
  • 怎样...怎样...怎样...(如"怎样收集信息,怎样组织判断,怎样沉淀经验")
  • 如何...如何...如何...(如"如何识别问题,如何做成工具,如何翻译工作")
  • 越...越...越...(如"越理解工具,越容易提升效率;越提升效率,越容易输出")

改写:将部分项合并为名词短语或动宾短语,打破统一句式。如"怎样收集信息,怎样组织判断,怎样沉淀经验"→"怎么收集信息、组织判断,怎么沉淀经验"(合并+缩减)。

改写:打破工整结构,改为陈述句或混合结构,避免三个以上相同结构的并列。

7. AI过渡语

必须检测的过渡语

  • 先把.*摆出来摆上台面
  • 不妨把.*拆成不妨
  • 这两个问题一问答案就清晰了
  • 这话对了一半这话没错
  • 我后来发现我也想过
  • 一个直接的原因一个现实的原因一个根本的原因
  • 一个很现实的原因是一个很直接的原因是
  • 原因很简单原因很直接
  • 这也是为什么(结论倒装式过渡,直接删除前缀即可)
  • 从一开始就(时间绝对化框架,如"从一开始就没有对准问题")

协作交流痕迹

  • 希望这对您有帮助当然!您说得完全正确!请告诉我以上是…
  • 改写:删除所有协作交流痕迹,直接陈述核心内容。

8. 自我陈述

必须检测的表述

  • 我更愿意我更倾向于
  • 我给自己定我设定了
  • 我想强调我想指出
  • 我期待我希望

渐进式自我陈述

  • 我越来越觉得我越来越认为我越来越倾向于我现在越来越
  • 整篇文章中"越来越"出现超过2次
  • 改写:直接陈述观点,删除"我越来越"前缀。最多保留一处"我逐渐意识到"。

9. 导语式口癖

必须检测的表述

  • 表面上看
  • 更关键的是更值得写的是更重要的是
  • 更大的变化在于更实质的变化是更X的是/更X的在于("更"字引导的递进式宣言)
  • 从经验看在实践中
  • 这当然成立毫无疑问
  • 接下来会接下来我们

频次表述重复

  • 很多时候(整篇文章出现超过2次)、往往通常(过度重复)
  • 改写:第一处保留,后续替换为"多数情况下"/"常常"/"一般而言",或直接删除。

模糊归因

  • 行业报告显示观察者指出专家认为多个来源(无具体出处)
  • 改写:删除模糊归因直接陈述,或提供具体来源"根据XX年XX的报告"。

知识截止免责声明

  • 截至 [日期]根据我最后的训练更新基于可用信息…在现有资料中…
  • 改写:直接陈述已知事实,删除免责声明。

10. 口号化隐喻

必须检测的表述

  • 信号、叙事、换挡、战场
  • 组合拳、闭环、模板、生态
  • 把……搬进、拖进……

11. 过度情绪化

必须检测的词汇

  • 扎心、硬、值钱、最大
  • 反复翻车

12. 过度强调知名度

必须检测的表述

  • 被.*多家媒体报道受到.*广泛关注
  • 独立报道、地方/区域/国家媒体
  • 由知名专家撰写专家团队
  • 活跃的社交媒体账号
  • 拥有超过.*粉丝关注者

改写:删除空洞的知名度强调,或提供具体有意义的内容。

二、弹性检测类(根据上下文判断)

以下模式需要根据文章风格、语境和目标读者来判断是否修改:

13. 无序列表

检测标准:列表是否在"堆积观点"而非"说明步骤";整篇文章无序列表出现超过2-3次应改为段落。

可接受场景:操作步骤、检查清单、核心框架列举。

内联标题垂直列表

  • - **用户体验:** 用户体验通过新界面得到显著改善(粗体标题+冒号的机械列表)
  • 改写:改为段落式表达或正常列表格式。

表情符号和粗体过度使用

  • 🚀 **启动阶段:**💡 **关键洞察:**、过度使用 **OKRs** 等粗体
  • 改写:删除表情符号和过度粗体。

14. 引号使用

检测过度使用

  • 引号密度过高(整篇文章大量使用引号)
  • 为普通词汇加引号(非术语、非引用)
  • 用引号表达"反讽"或"强调"
  • 半角英文引号 "..."
  • 半角单引号 '...'
  • 过度使用「」

AI写作特有的引号误用模式(必须检测)

以下类型的引号通常不需要,应去除:描述性短语("可调用的能力")、比喻性描述("Skill 的外壳")、口语化表达("能不能一键跑起来")、动作/状态描述("换一个 Skill")、属性列举("可组织、可迭代")、问题表达("Skill 很火")、价值判断("工作标准")。

正确使用引号的场景:引用原文、核心术语定义(首次出现)、避免歧义、特殊概念区分。

检测标准

  • 如果去掉引号后意思仍然清晰,通常不需要引号
  • 如果是普通词汇(名词、动词、形容词)的描述性用法,不需要引号
  • 如果是比喻、口语、动作描述,不需要引号
  • 整篇文章中应尽量减少引号密度
  • 优先保留:核心术语定义、原文引用

15. 评价式陈述与过度概括

必须检测的模式

  • 把.*讲得很清楚把.*说得很明白
  • 更尖更锐利更深刻(评价性形容词修饰抽象概念)
  • 更硬的定义更.*的.*(过度修饰的形容词结构)
  • 被.*卡住被.*阻挡(被动句式+过度概括)
  • 一旦把视角从.*就更容易看清(视角转换程式化)
  • 更具体一点更准确地说(AI式过渡语)

改写:直接陈述内容,删除评价性修饰和过渡语。"被两件事卡住"→"两件事挡在路中间","更具体一点"→直接进入具体内容。

16. 比较性与断定性表述

必须检测的模式

  • 它更像一种更像一个.*
  • 它其实是这里其实其实是第二类
  • 天然会天生就自然而然就
  • 会更清楚会更.*(过度使用的"会更"模式)
  • 就.*了就.*能(过于绝对的断言)

否定式断定性表述

  • 事实并不是这样事情并不是这样并不是.*而是其实并不是
  • 改写:删除否定前缀,直接陈述核心内容。"但情况并非如此"或直接进入事实。

改写方向

  • "它更像一种" → 直接说是什么
  • "它其实是" → 直接陈述事实
  • "天然会" → 用"通常会"、"往往"等弹性表达
  • "会更清楚" → 直接陈述效果
  • 整体策略:去掉前缀,直接陈述核心内容

17. 模糊频次词与客观让步姿态

模糊频次词(虚假普遍性)

  • 经常常常常常会 — AI 用这些词制造"普遍现象"的假象
  • 很容易 + 抽象判断(如"讨论很容易变窄")— 模糊频次 + 模糊后果的组合
  • 改写方向:用具体频次替代("最近几次聊到 X" 替代 "经常谈 X"),或直接删除频次修饰;模糊后果补充具体指向("变窄" → "局限在产品层面")

评价性断语(客观让步姿态)

  • 太绝对太武断话说得太死说过头了容易被反驳
  • 这个判断太X这种说法太Y — AI 先立靶子再打倒的程式化让步
  • 改写方向:用个人立场替代评价性断语("我不这么看" 替代 "这个判断太绝对"),或直接跳过让步,陈述自己的判断

改写对照

原文改写说明
经常听到一个判断最近几次都会碰到一个判断具体频次替代模糊词
讨论很容易变窄讨论就容易局限在产品层面补充"窄在哪"
这个判断太绝对,也容易被反驳说 X,我不这么看个人立场替代客观评价

工作流程

Step 1: 阅读理解

必须完整通读全文,理解核心观点、文章风格和上下文语境。不得仅通过正则/grep 匹配来检测——正则只能覆盖已知模式的精确形式,会遗漏大量语义等价但形式不同的变体。

Step 2: 识别AI化表述

以 Agent 通读全文的方式识别 AI 化表述。前文的核心检测规则(§总则 + §一~§二)是参考框架,不是穷举清单。Agent 应当:

  1. 先通读全文,凭借对 AI 写作模式的理解,识别所有疑似 AI 化的表述——无论是否出现在清单中。重点扫描以下热点区域
    • 节标题:标题中的"不在X""只是Y"等模式常被忽略
    • 加粗行和引用块:AI 倾向把最工整的对比句、宣言式断言放在 **粗体**> 引用
    • 段落首句和末句:AI 的过渡语和总结句最常出现在这些位置
  2. 再对照清单,补充通读时可能遗漏的频次超标(如 越来越 真正 不只 等超过 2 次的词)
  3. 向上溯源:清单中的每条规则代表一类模式。识别到未列出的表述时,判断它是否属于某个已知模式家族的变体(对比句式→递进结构→程式化转折→工整排比→程度副词堆叠→否定宣言→分离式对比→同义循环)

禁止的做法:仅用 grep/正则匹配清单中的关键词,然后声称检测完成。正则匹配只能作为频次统计的辅助工具,不能替代通读理解。

Step 3: 判断是否修改

不是所有匹配都需要修改。判断标准:是否影响表达自然度、是否符合文章风格、是否有修辞目的。

Step 4: 重新表述句子

核心原则:重新表述整个句子,不要只删除词汇或替换同义词。

错误(×):"它更像一种可维护的模块""这是一种可维护的模块"(只删词,结构没变) 正确(✓):"它更像一种可维护的模块""这种设计便于后续维护"(重构句子)

同义词替换是无效改写:把"窄"换成"局限"、把"小"换成"有限"、把"这不是"换成"那不是",句式和语气都没有变化,读者仍然能感受到 AI 味。必须在理解原句核心意思的前提下,换一种全新的表达结构。

原文无效改写(×)有效改写(✓)说明
格局一开始就小了格局一开始就窄了讨论就没抓到重点换了语义场,换了句式
这不是我理解的 AI那不是我关注的我关注的角度不太一样去掉否定宣言,换成个人立场
视野就窄了视野就局限了但只看到这些还不够彻底换一种表达
你越X,越Y;越Y,越Z你越X就越Y,越Y就越Z理解工具,效率会先提上来。有了余量,输出自然就多了长级联拆成短句

Step 5: 注入个人风格(可选)

在去除AI化表述后,可选地注入个人风格特征。目标比例:技术准确性 60% / 个人化 40%

正向特征

  1. 开头的真实感:用个人感受/具体场景/平实判断开头,不用"本文将探讨…"
  2. 弹性表达:保留"可能""往往""某种程度"等,不封死结论
  3. 有分寸的口语:"说实话""也许"可以,"搞定""跑偏"不行
  4. 自嘲式幽默:意外转折、反常识可以,炫耀式自夸不行
  5. 自然对比:"当然…但是…"可以,"并非…而是…"不行
  6. 句子节奏:长短句搭配,不刻意工整

参考文件(读取以获取详细指南):

  • reference/personal-style-guide.md:个人风格特征指南
  • reference/expression-transformations.md:表达方式转化对照表
  • reference/sentence-rhythm-guide.md:句子节奏指南
  • reference/quality-scoring.md:质量评分系统

Step 6: 标点符号修正(代码强制执行)

必须作为最后一步执行。 AI 修改文本后往往会遗留英文标点,纯靠 LLM 提醒修正效果不可靠,因此使用脚本强制转换。

python3 scripts/fix_punctuation.py <文件路径>

脚本会自动处理:

  • 英文引号 " → 中文引号 ""(交替状态机)
  • 中文语境中的 ,;?!
  • 中文语境中的 :()()
  • 中文字符后的 .

脚本会自动跳过以下区域不做转换:

  • YAML front matter(--- 之间的元数据)
  • Markdown 图片和链接语法(![]()[]()
  • 代码块和行内代码(````
  • URL 地址