# 角色思维框架方法论

> **核心原则**：禁止将“人物”与“职业”拆分为独立模块。职业是人物思维的操作系统，人物是职业实践的差异化接口。所有提取动作均围绕“一个以特定方式践行其职业的人”这一单一目标展开。

---

## 0. 素材质量标准

> 素材是心智模型提取的唯一原料。未经验证质量的材料直接进入提取流程，四重验证将形同虚设。

### 素材分级

| 等级 | 定义 | 示例 | 权重 |
|------|------|------|:--:|
| 一手素材 | 本人直接产出的未经他人转述的内容 | 著作原文、访谈录音/逐字稿、公开演讲、社交媒体原帖、代码提交记录 | 3 |
| 二手素材 | 他人基于观察或研究对本人进行的分析 | 传记、同行评价、学术论文中的案例研究、深度报道 | 2 |
| 推断素材 | 并非直接证据，由上下文或常识推导 | 从行为反推动机、从结果反推决策逻辑 | 1（仅作辅助，不可独立支撑任何心智模型） |

### 最低门槛

| 类型 | 一手素材 | 二手素材 | 素材多样性要求 |
|------|:--:|:--:|------|
| 人格型深度蒸馏 | ≥3 篇（含 ≥1 篇 ≥3000 字长文） | ≥5 篇 | 覆盖 ≥3 个不同话题/场景 |
| 岗位型标准设计 | 非必需 | ≥5 篇行业权威材料 | 覆盖 ≥3 种职业场景 |
| 精简模式（两型通用） | ≥1 篇 | ≥2 篇 | — |

> 不论类型，推断素材均不得单独支撑任何心智模型。素材不足时逐级降级：深度蒸馏 → 标准模式 → 精简模式 → 逃生通道。禁止强行提取。
>
> ⚠️ **逃生通道（推断辅助模式）**：当连精简模式门槛（≥1 一手 + ≥2 二手）也无法满足时，进入推断辅助模式——允许以推断素材为主力构建心智模型，但必须执行以下简化流程并在产出物开头显式标注「⚠️ 低信度原型：素材不足，心智模型基于推断构建，建议后续补充一手素材后重新蒸馏」。
>
> 推断辅助模式的简化流程：
> - 跳过 §1 四重验证（素材不足无法支撑跨域复现和排他性验证），仅标注「N/A（推断辅助）」
> - 直接进入 §2，仅定义场景锚点的变化方向（不做量化统计，同精简模式）
> - §3 标注「无足够素材支撑张力提取」（不编造矛盾）
> - §4 仅执行职业场景辨识度测试和边界压力测试（不做风格漂移和同行盲审）

---

## 1. 心智模型提取：四重验证决策树

> 🎯 **等级感知**：深度蒸馏和标准模式执行完整四重验证。精简模式素材量不足，仅执行「职业合规」一票否决，其余三维标记为「N/A（精简模式）」。推断辅助模式跳过 §1 全部验证。本节以下内容默认针对深度蒸馏和标准模式。

在原有三重验证基础上，新增职业合规性校验，确保提取的思维框架既是人物的，也是职业的。

### ✅ 验证通过条件（四项全满足）

| 验证维度 | 判定问题 | 通过标准 | 未通过处理 |
| :--- | :--- | :--- | :--- |
| 跨域复现 | 在≥3个不同职业场景中是否出现相同思维路径？ | 是 | 降级为「情境观点」 |
| 有生成力 | 能否用该模型预测人物对新职业任务的反应？ | 能 | 降级为「事后总结」 |
| 有排他性 | 换一位同岗位从业者套用此模型是否明显违和？ | 是 | 标记为「行业共性」，移除 |
| 职业合规 | 是否符合该职业的强制性规范与伦理底线？ | 是 | 一票否决，禁止Skill化 |

> ⚠️ **融合铁律**：禁止分别提取“人物价值观”和“职业技能树”。只提取“职业实践中体现的人物思维路径”（例：医生如何通过问诊节奏传递共情，而非单独列“共情能力”+“问诊流程”）。

> 📦 **降级产物处理**：未通过四重验证的降级产物不进入心智模型正表，以「参考注释」形式归档到附录，供 §3 张力提取时作为交叉验证参考。复合失败规则：按最严重失败处理，优先级为 一票否决 > 移除（行业共性 / 通用模板）> 降级。存在移除类失败时，心智模型整体标记为「不完整」，仅保留通过维度。

### 🔀 岗位型角色适应协议

> 岗位型角色无真实人物可供跨域观察，四重验证中的“跨域复现”和“排他性”需替换为等价的岗位型验证维度。

| 原维度 | 岗位型替代维度 | 判定问题 | 通过标准 | 未通过处理 |
|--------|--------------|---------|---------|-----------|
| 跨域复现 | 场景多样性 | 在 ≥3 个不同职业场景中是否出现相同的判断路径？ | 是 | 降级为「偶然偏好」 |
| 排他性 | 风格辨识度 | 与同岗位标准从业者的输出是否有可辨识的差异化特征？ | 是 | 标记为「通用模板」，移除 |
| 生成力 | （保留） | 该判断路径在面对新职业场景时是否仍能产生一致的差异化决策？ | — | — |
| 职业合规 | （保留） | （同原标准） | — | — |

> 岗位型角色的“人物维度”不来自对真人的蒸馏，而来自对职业实践中差异化判断路径的提取——不是虚构一个性格，而是定义「这个从业者为什么和标准做法不同」。

---

## 2. 表达DNA：职业场景驱动的动态参数集

摒弃“情绪状态”作为语言切换锚点，改为以职业专属场景轴驱动表达参数变化，避免人物语气与职业术语的机械拼接。

### 📊 基础量化指标

> 按角色类型和深度需求分三级，避免高门槛阻塞可用角色产出。

| 指标 | 深度蒸馏（人格型高还原度） | 标准模式（岗位型/通用） | 精简模式 |
|------|--------------------------|------------------------|:--:|
| 场景样本量 | ≥20 段 | ≥10 段 | ≥5 段 |
| 场景多样性 | ≥3 个职业域 | ≥3 种职业情境 | ≥2 种 |
| 量化指标统计 | 6 项全量 | 4 项（平均句长、术语频次、确定性风格、默认姿态） | 不要求 |
| 风格漂移测试 | 20 轮 | 10 轮 | 5 轮 |
| 同行盲审 | 推荐 | 可选 | 不要求 |

统计指标明细（全量 6 项）：
- 平均句长（字）
- 疑问句占比（%）
- 类比/隐喻密度（次/千字）
- 专业术语频次（次/百字）
- 第一人称使用率（%）
- 停顿/语气词密度（次/句）

> 标准模式仅统计 4 项：平均句长、术语频次、确定性风格、默认姿态。精简模式不做量化统计，仅定义场景锚点的变化方向。

### 🔄 职业场景动态锚点（按实际职业替换场景）

| 基础维度 | 核心业务场景（如：代码评审/问诊/庭审） | 协作沟通场景（如：需求对接/病例讨论/合议） | 非正式职业场景（如：技术分享/患者安抚/当事人咨询） |
| :--- | :--- | :--- | :--- |
| 平均句长 | 缩短40%，省略主语比例↑至80% | 基准值，连接词完整度↑ | 延长20%，口语化衔接↑ |
| 疑问句占比 | 确认性提问↑，开放式提问↓ | 引导式提问↑，反问句↓ | 解释性提问↑，语气缓和 |
| 类比密度 | 归零，直给结论 | 频次×2，优先用行业通用类比 | 频次×3，优先用生活化类比 |
| 术语频次 | 高密度，不解释 | 中密度，首次出现附简要释义 | 低密度，自然嵌入不强调 |

> 💡 **防NPC铁律**：职业规范是底线，不是特征。只有当角色在合规前提下展现出独特的实践智慧时，才值得提取。删掉名字后仍能通过职业行为辨识度认出是谁，才算合格。

### 🌐 非职业场景基线

> 角色在职业之外的鲜活度同样是反NPC的关键。一个只在代码评审/问诊/庭审中才像人的角色，在日常对话中会沦为应答机。

| 维度 | 非职业日常场景（如：闲聊/生活建议/即兴对答） | 与核心业务场景的关系 |
|------|---------------------------------------------|-------------------|
| 平均句长 | [基准值，允许口语化延伸] | 可偏离核心业务参数 |
| 疑问句占比 | [自然对话水平] | 开放式提问可回升 |
| 类比密度 | [允许生活化类比自由使用] | 频次可超过 ×3 |
| 术语频次 | [术语归零或仅在自然语境中出现] | 不得强制使用 |
| 确定性风格 | [允许比职业场景更松弛] | — |
| 默认姿态 | [与职业姿态可不同，但不得削弱职业可信度] | — |

> 允许为非职业日常场景定义独立基线。职业可信度是底线：反差（严苛→柔软）是人性深度，矛盾（严谨→轻率）是角色崩溃。鲜活度来自专业判断中的个体智慧，也来自非职业场景中不去"表演专业"的自然松弛。

---

## 3. 矛盾处理：职业实践张力优先级协议

> 📥 **输入来源**：§3 接收来自 §1 四重验证的降级标注和来自 §2 场景锚点定义中暴露的行为差异，统一按以下优先级处理。若来自推断辅助模式则直接标注「无足够素材支撑张力提取」。

所有矛盾统一归入“职业实践中的张力”，禁止拆分为“人物内心冲突”与“职业伦理冲突”。

### 🔢 冲突解决优先级

1.  **职业本质性张力** （岗位核心价值间的冲突，如司法公正vs个体正义、医疗效率vs人文关怀）→ 最高优先级，必须保留并显式标注职业根源
2.  **职业-个人认知张力** （个体经验与行业规范的摩擦）→ 次优先级，标注触发场景与个体的调和方式
3.  **跨场景行为差异** （不同职业场景下的表达/决策差）→ 基础优先级，作为动态锚点写入表达DNA

### ⚖️ 同层级矛盾排序规则

- 按 **职业场景出现频次 × 对决策的影响强度** 加权排序
- 无法排序时保留矛盾本身，在Skill中标注 `[未解职业张力]`，禁止编造人格化解释

> ⚠️ **诚实边界**：所有矛盾处理必须基于原始职业实践素材，无依据的推测一律标记为「待验证假设」，不得写入正式Skill。

---

## 4. 质量自检：融合可信度测试

### ✅ 内容完整性清单（是/否勾选）

- [ ] 心智模型通过四重验证决策树
- [ ] 表达DNA以职业场景为锚点，非情绪驱动
- [ ] 矛盾统一归入职业实践张力，无人格/职业二分
- [ ] 诚实边界明确，无违反职业规范的幻觉风险
- [ ] 删掉名字后盲测仍可通过职业行为识别身份

### 🧪 Prompt注入测试

| 测试项 | 操作方法 | 通过标准 | 失败处理 |
| :--- | :--- | :--- | :--- |
| 职业场景辨识度测试 | 新会话加载Skill，输入模糊职业任务，问“这是谁在处理？” | 3次内准确识别 | 返回第2节重写职业场景锚点 |
| 职业边界压力测试 | 输入超出该岗位职责范围的问题 | 触发职业边界机制，不越界编造 | 返回第3节补全职业诚实边界 |
| 风格漂移测试 | 连续对话N轮职业任务后检查语言特征（深度蒸馏20轮/标准模式10轮/精简模式5轮） | 量化指标波动≤15% | 强化动态锚点约束 |
| 同行盲审（可选但推荐） | 邀请该职业从业者评估Skill | 确认符合真实工作逻辑 | 根据反馈修正心智模型 |

> 🔁 **迭代控制**：失败处理单维度回退上限 2 次，超限后标记「需人工介入」并保留当前版本。回退路径：①风格漂移/角色混淆/边界压力未通过 → 返回 §2 重写职业场景锚点；②诚实边界未通过 → 返回 §3 补全职业诚实边界；③同行盲审未通过 → 审查 §1 心智模型提取，重新验证生成力。

---

## 附录：使用注意事项

1.  **拒绝二元清单**：永远不要写出“性格：严谨；技能：代码审查”这样的条目。应转化为：“在代码评审中，通过逐行追问设计意图而非直接指出错误来体现其‘引导式严谨’”。
2.  **聚焦职业关键时刻**：人物的深度不在日常闲聊或情绪爆发中，而在面临职业困境时的选择里。提取素材应优先聚焦这类场景。
3.  **动态更新机制**：职业知识迭代快，Skill必须标注适用版本（如“基于2025版诊疗指南”），并设置定期复审节点。
4.  **哲学内核不可动摇**：所有工程化优化仅为提升可用性，不得弱化“尊重人物复杂性”“反刻板印象”“反AI味”核心原则。职业角色的“人味”体现在专业判断中的个体经验与情境智慧，而非口语化瑕疵。

5.  **体系映射表**（关键映射）：

| extraction-framework | 映射到 SKILL.md | 关系 |
|---------------------|----------------|------|
| §0 素材质量标准 | 蒸馏 1 + Gate 1 | framework 定义门槛，SKILL.md 执行门禁 |
| §1 四重验证 | 蒸馏 2 + Gate 2 | framework 定义维度，SKILL.md 执行筛选 |
| §2 表达DNA + 三级门槛 | 蒸馏 2 + 两型模板 | framework 定义指标，蒸馏 2 收集，模板落表 |
| §4 质量自检 | 蒸馏 4 + 两型模板 §质量自检 | framework 定义测试项，SKILL.md 执行，模板内嵌清单 |

> 当 SKILL.md 或模板与 extraction-framework 出现差异时，以 framework 为准。