# humanizer.md — AI 写作痕迹去除(中文 + 期货/财经赛道适配版)

> **文档类型**:Skill 参考文档(去 AI 化引擎)
> **适用 Skill**:`xhs-creator-copilot` v1.0+
> **目标路径**:`references/humanizer.md`
> **版本**:1.1.0
> **最后更新**:2026-04-27
> **设计参考**:Wikipedia "Signs of AI writing" 指南 + ClawHub `biostartechnology/humanizer` skill 思路,**已中文化并适配期货/财经赛道**

---

## ⚠️ 合规边界声明(v1.1.0 强化)

**本模块的目的是让文字"读起来更自然",不是"骗过 AI 检测器"。**

依据 2026-02-12 小红书 AI 内容治理公告 + GB 45438-2025 国标:

- 平台采用**双轨识别**(技术轨 + 行为轨),humanizer 改写**不能**长期"绕过"检测
- humanizer 改完后,用户**仍然**必须在发布时勾选"笔记含 AI 合成内容"(后台标识)
- 输出的笔记 final 文件**自动追加**正文级 AI 标识声明:"本文部分内容由 AI 辅助生成"
- 用户**不得**手动删除该正文标识 — 否则违反《标识办法》

**正确流程**:humanize 改文风 + 主动勾选 AI 标识 = 平台官方承诺**不限分发**。
**错误流程**:humanize 改文风 + 隐瞒 AI 属性 = 被识别后限流 + 信用记录。

---

## 0. 为什么需要这一步

小红书在 2025-09 之后启用「机器+人工」双重 AI 内容识别(包括音画识别和文本识别),且 2026-03 之后对 AI 托管账号梯度处罚到永封。**未做去 AI 化处理的内容,有三大风险**:

1. **限流风险**:平台识别为 AI 生成 → 限制分发
2. **降权风险**:连续多篇 AI 味浓的内容 → 账号整体推荐权重下降
3. **被举报风险**:小红书读者对 AI 味敏感,期货/财经赛道用户尤其反感"机器感",举报会触发人工审核

**我们的目标不是"骗过 AI 检测器"**(这是反对抗赛跑,会输),**而是产出"真人会写出来的内容"**:有口语颗粒、有具体细节、有个人情绪、有不完美的句法。这本身也提升了内容质量。

---

## 1. 检测模式总览(24 类)

中文版 AI 写作痕迹分四大类共 24 个模式。每个模式都有**识别标志 + 改写策略**。

| # | 类别 | 模式名 | 严重度 | 中文典型表现 |
|---|------|--------|--------|------------|
| 01 | 词汇 | 夸大修饰滥用 | 🔴 高 | 卓越、非凡、显著、深刻、关键、至关重要 |
| 02 | 词汇 | 推销式语言 | 🔴 高 | 标志性、突破性、革命性、引领、赋能 |
| 03 | 词汇 | AI 高频词 | 🔴 高 | 探索、构建、塑造、绽放、织就、谱写 |
| 04 | 词汇 | 抽象名词堆砌 | 🟡 中 | 维度、层面、本质、内核、底层逻辑 |
| 05 | 词汇 | 万能形容词 | 🟡 中 | 多元、丰富、深度、立体、全方位 |
| 06 | 句式 | 三段式排比泛滥 | 🔴 高 | "不仅...而且...更..."、"既...又...也..." |
| 07 | 句式 | 否定式排比 | 🟡 中 | "不是...不是...而是..." |
| 08 | 句式 | 浮于表面的"-ing"分析 | 🔴 高 | "深入剖析着...、生动诠释着..." |
| 09 | 句式 | 模糊归因 | 🔴 高 | "有研究表明"、"业内人士指出"、"专家认为" |
| 10 | 句式 | 总分总死结构 | 🔴 高 | 开篇定调 + 三点展开 + 升华结尾 |
| 11 | 句式 | 过度连接词 | 🟡 中 | 然而、因此、综上所述、值得一提的是 |
| 12 | 句式 | 平衡对仗执念 | 🟡 中 | 每段字数雷同、每点长度一致 |
| 13 | 标点 | 破折号 — 滥用 | 🟡 中 | 中文文本里出现大量长破折号 |
| 14 | 标点 | 双引号包装术语 | 🟢 低 | 把普通词都加上"引号""来""强调" |
| 15 | 风格 | 升华癖(意义膨胀)| 🔴 高 | "这不仅是 X,更是对 Y 的深刻诠释" |
| 16 | 风格 | 通用结尾套话 | 🔴 高 | "总而言之、让我们一起、期待未来" |
| 17 | 风格 | 万金油开场 | 🔴 高 | "在这个 X 的时代""随着 Y 的发展" |
| 18 | 风格 | 价值观抒情结尾 | 🟡 中 | 突然升华到"美好生活""时代精神" |
| 19 | 风格 | 客观中立腔 | 🟡 中 | 全篇没有第一人称的真实情绪 |
| 20 | 风格 | 完美主义文风 | 🟡 中 | 没有口误、没有犹豫、没有"嗯…" |
| 21 | 内容 | 缺具体细节 | 🔴 高 | 全是概念描述,没有具体数字/时间/地点 |
| 22 | 内容 | 同质化举例 | 🟡 中 | 例子是"小李、小王"这种符号化 |
| 23 | 内容 | 过度全面 | 🟡 中 | 一个回答把所有可能性都列出来 |
| 24 | 内容 | 列表化思维 | 🔴 高 | 任何东西都拆成 1234 编号 |

🔴 高严重度 = 必须改写;🟡 中 = 建议改写;🟢 低 = 提醒用户但可保留

---

## 2. 各模式详解 + 改写策略

### 2.1 词汇类(模式 01-05)

#### 模式 01 — 夸大修饰滥用 🔴

**识别**:每段都有"卓越""非凡""显著""深刻""关键""至关重要""极致"

**坏例子**(AI 味满分):
> 期货市场的杠杆机制具有**至关重要**的作用,它**深刻**改变了**卓越**的资金效率,**显著**提升了风险对冲能力。

**改写策略**:删掉这些词,大多数情况下句子反而更清晰。

**好例子**(改写后):
> 期货的杠杆把资金效率拉高了好几倍,但风险也跟着放大。

#### 模式 02 — 推销式语言 🔴

**识别**:"标志性""突破性""革命性""引领""赋能""驱动""焕新"

**坏**:
> 这是**标志性**的交易策略,**革命性**地**赋能**了散户的盈利能力。

**好**(改写后):
> 这套策略我用了两年,亏过也赚过,适合中小账户。

**期货赛道额外提醒**:这类词在财经语境里更可疑,容易被读者识别为"软广"。

#### 模式 03 — AI 高频词 🔴

**强力警示词**(出现一个就要警惕,出现三个建议整段重写):

```
探索、构建、塑造、绽放、织就、谱写、铸就、雕琢、勾勒、描摹、
开启、扬帆、启航、翱翔、深耕、洞悉、洞察、解锁、点亮、照亮、
重塑、重新定义、深度、维度、生态、闭环、链路、赛道、抓手
```

**坏**:
> 让我们一起**探索**期货的**深度**和**维度**,**构建**属于自己的交易**生态闭环**。

**改写策略**:全部替换成具体动作或直接删除。

**好**:
> 我做期货三年,聊聊我用过的几个具体方法。

#### 模式 04 — 抽象名词堆砌 🟡

**识别**:连续 2 个以上抽象名词:"维度""层面""本质""内核""底层逻辑""核心要素""关键节点"

**改写策略**:把抽象名词拆解成具体描述。

**坏**:
> 期货交易的**底层逻辑**有三个**核心维度**:风险控制、资金管理、心态建设。

**好**:
> 期货想活下去要管三件事:别一把梭、留够保证金、亏的时候别加仓。

#### 模式 05 — 万能形容词 🟡

**识别**:"多元""丰富""深度""立体""全方位""沉浸式""场景化"

**改写策略**:用更具体的形容词或干脆描述具体场景。

---

### 2.2 句式类(模式 06-12)

#### 模式 06 — 三段式排比泛滥 🔴

**识别**:"不仅...而且...更..." / "既...又...也..." / "从...到...再到..."

**坏**:
> 期货**不仅**是金融工具,**而且**是风险管理手段,**更**是价值发现机制。

**改写策略**:拆成短句,删掉连接词,允许节奏不齐。

**好**:
> 期货本质上是一种合约,你和别人约定未来某个价格交割某种商品。这玩意儿一开始是给农民对冲价格用的。

#### 模式 07 — 否定式排比 🟡

**识别**:"不是 X、不是 Y、而是 Z" 三段式

**坏**:
> 期货**不是**赌博,**不是**投机,**而是**一种风险管理工具。

**好**:
> 很多人把期货等同于赌博,其实最初是给农民锁价用的。当然,被怎么用是另一回事。

#### 模式 08 — 浮于表面的 -ing 分析 🔴

**识别**:中文里大量出现"...着"的形容词性结构,本质是英语 -ing 的直译

**信号词**:深刻揭示着、生动诠释着、有力推动着、持续优化着、不断完善着

**坏**:
> 这次行情**深刻揭示着**市场的脆弱性,**生动诠释着**风险管理的重要性。

**好**:
> 这次跌穿,我止损扛了 5 分钟才砍,扣完手续费亏 8%。下次绝不犹豫。

#### 模式 09 — 模糊归因 🔴

**识别**:"有研究表明""业内人士指出""专家认为""数据显示"+ 没有具体来源

**改写策略**:要么补具体来源,要么改成第一人称的"我看到/我听说/我经历过"。

**坏**:
> **有研究表明**,期货市场 90% 的散户最终都是亏损的。

**好**:
> 我自己见过的几个交流群里,长期能盈利的不到一成。

#### 模式 10 — 总分总死结构 🔴

**识别**:开篇一段定调 → 三点 / 三段并列展开 → 结尾一段升华

**改写策略**:打乱节奏。可以**直接从最具体的细节开头**,也可以**没有结尾段**戛然而止。

**坏**:
```
[开篇] 期货是一种重要的金融工具,有三大特征。
[展开] 1. 杠杆性 2. 双向交易 3. T+0 机制
[升华] 综上,期货为投资者提供了多元化的工具选择。
```

**好**:
```
昨天有个粉丝问我"期货能做空吗",我才意识到很多人不知道这事。
顺便聊聊,期货和股票最大的区别就是双向 + 杠杆 + T+0 这三个。
没了,就这。
```

#### 模式 11 — 过度连接词 🟡

**识别**:几乎每句开头都有"然而""因此""与此同时""综上所述""值得一提的是""不可否认"

**改写策略**:删除 80% 的连接词,中文短句之间的逻辑读者自己能补。

#### 模式 12 — 平衡对仗执念 🟡

**识别**:每段字数差不多、每点字数雷同、句子长短近似一致

**改写策略**:**故意写长短不一**。一段 300 字 + 一段 30 字是真人节奏,一段一段都 100 字是 AI 节奏。

---

### 2.3 标点类(模式 13-14)

#### 模式 13 — 破折号 — 滥用 🟡

**识别**:中文文本里出现 ≥ 2 个长破折号 ——

**真人写作的中文**很少用 ——,常用的是逗号、句号、括号、冒号。

**改写策略**:把 — 全部替换成逗号或句号。

**坏**:
> 期货 — 一种标准化合约 — 是风险管理工具 — 也是投机工具。

**好**:
> 期货是标准化合约,既能用来对冲风险,也能用来投机。

#### 模式 14 — 双引号包装术语 🟢

**识别**:把普通词、口语词加引号"强调"

**改写策略**:删除引号,口语就让它口语。

---

### 2.4 风格类(模式 15-20)

#### 模式 15 — 升华癖(意义膨胀) 🔴

**识别**:把一件具体小事**强行**关联到"时代""精神""价值""使命"

**坏**:
> 学会期货不仅是掌握一项技能,**更是对自身认知边界的拓展和对金融文明的深刻理解**。

**好**:
> 学期货说白了就是学会"亏得起",其他的都是后话。

#### 模式 16 — 通用结尾套话 🔴

**死亡词组**:"总而言之""综上所述""让我们一起""期待未来""共同见证""一起加油""值得每一位 X 深思"

**改写策略**:**直接删掉结尾段**。中文小红书笔记不需要结尾升华,真人很多就是"突然就结束了"。

#### 模式 17 — 万金油开场 🔴

**死亡开头**:
- "在这个 X 的时代"
- "随着 Y 的快速发展"
- "众所周知"
- "近年来"
- "当我们谈到 X"

**改写策略**:**直接从最具体的场景或一句口语开头**。

**坏**:
> 在这个金融市场快速变化的时代,期货作为重要的风险管理工具...

**好**:
> 昨晚做单子做到 3 点,凌晨被强平,亏了 2 万 8。

#### 模式 18 — 价值观抒情结尾 🟡

**识别**:具体内容讲完后,突然来一段"愿你""每个人都""人生 / 时代 / 选择"

**改写策略**:删掉。

#### 模式 19 — 客观中立腔 🟡

**识别**:全篇用第三人称,没有"我"、"我当时"、"我之前"

**期货赛道**特别要警惕:这类内容看起来"专业",但读者会觉得是软文。**你必须出现在自己的笔记里**。

#### 模式 20 — 完美主义文风 🟡

**识别**:句句通顺、零废话、零口语颗粒

**改写策略**:**主动加一些口语颗粒**(在 §3 详述)。

---

### 2.5 内容类(模式 21-24)

#### 模式 21 — 缺具体细节 🔴

**最致命的 AI 味**。AI 倾向于"概念描述",真人倾向于"具体细节"。

**改写策略**:每篇笔记**至少塞进 3 个具体颗粒**(数字、时间、地名、品牌、动作、感受)。

**坏**:
> 我经常做沪铜,有过几次失败的经验。

**好**:
> 我去年 11 月做了一手沪铜 2412,挂在 70850 想抄底,结果第二天直接跌穿 70000,扣手续费亏了 4500。

#### 模式 22 — 同质化举例 🟡

**识别**:"小李""小王""小张""有个朋友"

**改写策略**:用真实记忆里的人、用具体场景代替符号化人物。

#### 模式 23 — 过度全面 🟡

**识别**:一个问题里把所有可能性都列了一遍,失去焦点

**改写策略**:**只讲一个点**。其他的让读者评论区问。

#### 模式 24 — 列表化思维 🔴

**识别**:任何论述都拆成"1. 2. 3."编号 / "三个特点""五个要点"

**改写策略**:在小红书,适度的列表是 OK 的(便于阅读),但**不要每篇都是列表**。可以:
- 列表 + 散文段落穿插
- 把"三个要点"拆成三个独立小段落,但不写编号
- 故意写成 2 个要点或 4 个要点(打破"三"的执念)

---

## 3. humanize 等级与具体操作

skill 提供三档等级,默认 `medium`:

### 3.1 light(轻度)

**适用**:用户原文已经比较口语化,只想清理明显的 AI 味

**操作**:
- ✅ 删除模式 01-03(夸大修饰、推销词、AI 高频词)
- ✅ 删除模式 11(连接词)
- ✅ 替换模式 13(— 替换为标点)
- ✅ 删除模式 16-17(套话开头/结尾)
- ⏸️ 不动模式 06、08、10、15(保留原结构)

### 3.2 medium(默认)

**适用**:大多数 LLM 直出的内容

**操作**:在 light 基础上额外执行:
- ✅ 改写模式 06-08(三段排比、否定排比、-ing 分析)
- ✅ 改写模式 09(模糊归因 → 第一人称)
- ✅ 改写模式 10(打乱总分总,允许戛然而止)
- ✅ 改写模式 15(去除升华癖)
- ✅ 强制满足模式 21(至少 3 个具体颗粒)
- ✅ 强制满足模式 19(至少出现 1 次"我")

### 3.3 aggressive(强力)

**适用**:LLM 痕迹特别重(可能是用了通用 prompt 直接生成的内容);或赛道极度敏感

**操作**:在 medium 基础上额外:
- ✅ 主动加入"口语颗粒"(见 §4)
- ✅ 主动制造"轻度不完美":句法允许残缺、长短句故意不齐、允许跳跃逻辑
- ✅ 主动加入个人情绪信号(见 §5)
- ✅ 整段重写,不做局部替换

---

## 4. 口语颗粒库(中文 + 期货圈适用)

humanize 时可以**适度**加入这些"真人写作信号":

### 4.1 语气词(每篇 1-2 处)

啊、吧、呢、呗、嘛、咯、哈、唉、喏、哦、嗯

### 4.2 口头禅(每篇最多 1 处)

说真的、讲真、老实说、不是我吹、给你说、我跟你讲、扪心自问

### 4.3 网感词(谨慎使用,期货圈半数读者反感过度网感)

破防了、绷不住、给我整破防、属实、确实、栓 Q(慎用)、笑死、绝了

### 4.4 期货圈黑话(适度,显示圈内人身份)

老盘子、新韭菜、扛单、加马、止损位、多翻空、空翻多、洗盘、爆仓、强平、保证金、过山车、撸了、亏麻了、博一手、做 T、隔夜单、开盘搏一搏

### 4.5 自嘲词(强烈推荐,期货圈尤其管用)

割肉、亏麻了、又交学费了、这把又给主力送钱了、心态崩了、洗澡躺平、再也不碰了

### 4.6 具体颗粒锚点(每篇至少 3 个)

- **时间**:昨晚、今早 9 点、上周三、4 月 22 号、凌晨 3 点
- **数字**:亏了 2 万 8、保证金 12% 、跌了 1.3%、做了 2 手
- **品种**:沪铜 2412、豆粕 2509、棕榈 2505
- **平台/工具**:文华财经、博易大师、CTP、文华 7
- **场景**:盯着 K 线、刷着行情、电脑还开着、手都麻了

---

## 5. 个人情绪信号库

期货赛道笔记有人味的关键之一是**情绪暴露**。可以适度加入:

| 情绪类型 | 信号词 | 例子 |
|---------|-------|------|
| 自嘲 | 我又、我属实、我服了 | 我又给主力送钱了 |
| 困惑 | 我也搞不懂、我没想明白 | 这破行情我也没想明白 |
| 后怕 | 当时还好、不然真完了 | 当时多挂了 5 个点止损,不然真给我打爆 |
| 经验感 | 这种我见过、之前类似 | 这种走法我去年 11 月见过一次,然后被洗 |
| 疲惫 | 累了、不想再 | 真累,这周不想再开仓了 |

**关键**:每篇插 1-2 处即可,过多反而像"装人"。

---

## 6. 处理流程(skill 内部执行)

收到一段需要 humanize 的文本后:

```
Step 1  扫描 24 模式,标记命中清单
Step 2  根据 humanize_level 决定改写哪些
Step 3  生成"对照表"(原文 vs 改写,逐段)
Step 4  整段重写后输出
Step 5  二次扫描,如仍有 ≥3 个 🔴 模式命中,提示用户考虑 aggressive
Step 6  输出 AI 味评分(0-100,越低越像真人)
```

### 6.1 输出格式示例

```markdown
# Humanize 处理报告

**原文长度**:438 字
**处理等级**:medium
**AI 味评分**:原文 78 分 → 改写后 22 分(满分 100,越低越像真人)
**命中模式**:#01 (3处)、#03 (4处)、#06 (2处)、#10、#15、#21

---

## 改写后正文

(此处放改写后的内容,可直接复制使用)

---

## 详细对照(可折叠查看)

### 段 1
**原文**:在这个金融市场快速变化的时代,期货作为重要的风险管理工具,
具有至关重要的作用...
**改写**:昨晚做单子做到 3 点,被强平后我才想起来,期货这玩意儿本来
是给农民对冲用的...
**改动原因**:#17 万金油开场、#01 夸大修饰、#21 缺具体细节

### 段 2
...
```

---

## 7. 使用场景调用方式

### 7.1 主流程默认调用(content.md / faq-draft.md / reply-triage.md 内部都会调用)

skill 完成内容生成后,**自动**走 humanize medium 流程,**不需要用户单独触发**。

### 7.2 用户独立调用

```
用户:这段话帮我去 AI 化
用户:这段太机器了,humanize 一下
用户:用 aggressive 等级改写这段
```

skill 直接进入 humanizer 流程,task_type=`humanize`。

### 7.3 用户审阅后微调

```
用户:第二段改得不太好,口语化过头了,light 一点
```

skill 用 light 等级重新处理第二段。

---

## 8. 不该 humanize 的场景(诚实警告)

**有些内容不适合做 humanize**,强行处理反而出问题:

- ❌ **法律免责声明**("不构成投资建议、仅供参考"):这部分需要正式严肃,不能口语化
- ❌ **数据播报型笔记的核心数据段**(数字 + 品种 + 涨跌幅):这部分本来就是客观陈述
- ❌ **专业术语的首次定义**:首次解释"保证金"、"基差"时要准确,口语化反而误导

skill 在 humanize 时应**自动跳过**这些区段,或仅做 light 处理。

---

## 9. 与其他模块的协作

| 调用方 | 默认等级 | 调用时机 |
|-------|---------|---------|
| `content.md` | medium | 三版本起草后,输出前自动处理 |
| `faq-draft.md` | medium | 候选回复生成后自动处理 |
| `reply-triage.md` | light | 批量分诊场景下,候选回复较短,light 即可 |
| 用户独立调用 | 用户指定,默认 medium | 任意 |

---

## 10. 版本历史

| 版本 | 日期 | 变更 |
|------|------|------|
| 1.0.0 | 2026-04-25 | 首版,基于 Wikipedia "Signs of AI writing" 中文化 + 期货赛道适配 |
| **1.1.0** | **2026-04-27** | 强化合规边界声明:对齐 2026-02-12 小红书新规 + GB 45438-2025 国标。明确"humanize 不为绕过检测,正确流程是 humanize + 主动勾选 AI 标识"|

---

*— EOF —*
