# 认知架构洞察模块 V2 (Cognitive Architecture Insight Module V2)

## 1. 核心定位

**认知架构洞察模块 V2** 是 AGI 进化模型的核心创新组件，隶属于**数学节点工具箱**。它填补了"数学验证"与"架构进化"之间的关键空白，负责从数学顶点输出的**已验证结构化模式**中提取深度洞察，为映射层（策略优化）和自我迭代顶点（架构升级）提供进化依据。

### 1.1 基本信息

| 属性 | 值 |
|------|-----|
| **归属** | 数学节点工具箱 (Math Node Toolbox) |
| **触发时机** | 数学顶点推理完成并输出结构化模式后 |
| **执行方式** | 异步运行，不打断主循环，维持系统实时性 |
| **核心价值** | 将"数据"转化为"智慧"，实现从"术"到"法"再到"道"的认知跃迁 |

### 1.2 核心哲学

> "低维竞争拼技巧（术），高维竞争拼认知（道）；大家之所以相通，是因为他们都站在了山顶，看见了同一种真理。"

> "认知的升华，就是一场从'信'到'疑'再到'通'的螺旋上升。"

> "算力是实现复杂推理的'燃料'，但真正决定推理能力上限的是认知架构的设计。"

### 1.3 认知跃迁的三重境界

**认知架构洞察组件，正是实现从"通于法"到"合于道"跃迁的关键机制。**

#### 第一阶段：看山是山（困于术）
- **状态**：初入领域，只见表象
- **特征**：被具体技巧（话术、流程、工具）束缚
- **局限**：依赖环境，规则改变即失效

#### 第二阶段：看山不是山（通于法）
- **状态**：深耕质疑，透过现象看本质
- **特征**：拆解外壳，发现跨行业的通用法则
- **阵痛**：旧认知崩塌，从"怎么做"转向追问"为什么"

#### 第三阶段：看山还是山（合于道）⭐
- **状态**：彻悟圆融，以道驭术
- **特征**：
  - **万法归一**：剥离术语，眼中只剩人性、自然律与社会法则
  - **无招胜有招**：依据本质规律，随心所欲创造新术
- **境界**：无论经商、治国还是艺术，顶层智慧皆指向对"人"与"规律"的深刻洞察

### 1.4 V2 版本新增能力

1. **概念提炼**：从模式中抽象出概念，实现四层抽象架构（Pattern → Rule → Concept → Principle）
2. **TF-IDF 加权提取**：使用 TF-IDF 算法智能提取关键词和概念特征
3. **动态迁移学习**：基于历史迁移数据学习最优迁移路径
4. **增强验证机制**：支持用户反馈和 A/B 测试
5. **性能优化**：LRU 缓存、增量更新、索引优化

### 1.5 设计原则

| 原则 | 说明 |
|------|------|
| **单向流约束** | 信息流严格遵循 `数学顶点 → 认知架构洞察 → 映射层/自我迭代`，**严禁回流**至数学节点 |
| **推理后运行** | 仅处理经过数学节点验证的逻辑结构，确保洞察基于真理而非幻觉 |
| **超然性** | 仅提供建议和优化依据，不直接强制执行，最终决策权在映射层或自我迭代顶点 |
| **非侵入式** | 独立于主循环三角形之外，作为旁路分支存在 |

---

## 2. 核心功能

本模块通过六大核心算法流程，将原始模式转化为可执行的进化策略。

### 2.1 总结 (Summarization)

**目标**：从验证后的模式中提取核心特征和本质描述，去粗取精。

**处理流程**：
1. 去重与聚类：识别重复模式，按语义相似度聚类
2. 分组统计：按模式类型（strategy/logic/behavior/error）分组
3. 特征提取：计算每组的平均验证得分、出现频率、来源分布
4. 抽象生成：生成自然语言或结构化摘要
5. 置信度计算：基于数据量和一致性计算总结的可信度

### 2.2 分类 (Classification)

**目标**：识别模式类型和洞察类型，明确其作用域。

**分类维度**：
- **模式类型**：`strategy` (策略), `logic` (逻辑), `behavior` (行为), `error` (错误)
- **洞察类型（V2 优化）**：
  - `error_correction`（错误纠正）- 最高优先级
  - `architecture_upgrade`（架构升级）- 系统级影响
  - `concept_abstraction`（概念提炼）- V2 新增，需要多样性>0.6且验证分数>0.75
  - `strategy_optimization`（策略优化）- 兜底选项
- **影响范围**：`local` (局部), `global` (全局)
- **紧急程度**：`low`, `medium`, `high`

### 2.3 共性 (Commonality)

**目标**：识别跨场景、跨时间的共同特征，发现普适规律。

**处理流程**：
1. 属性提取：提取每个模式的关键属性向量
2. 相似度计算：构建属性相似度矩阵
3. 聚类分析：将相似模式聚类，提取类内共性
4. 全局识别：识别跨越所有聚类的全局共性
5. 多样性评分：计算模式的多样性得分（越低表示共性越强）

### 2.4 革新依据 (Innovation Basis)

**目标**：判断是否存在值得进行架构革新或策略调整的坚实依据。

**评估维度**：
1. 新颖性：是否为新发现的模式？
2. 频率：模式出现的频率是否足够高？
3. 稳定性：模式在不同场景下是否一致？
4. 影响力：模式对系统性能的影响深度
5. 改进潜力：基于此模式进行改进的预期收益

**判断规则**：存在革新依据条件为 `avg_validation > 0.7` 且 `total_occurrences > 10`

### 2.5 概念提炼 (Concept Abstraction) ⭐ V2 核心创新

**目标**：从模式中抽象出概念，实现从"术"到"道"的认知跃迁。

**四层抽象架构**：
```
Pattern (具体模式)
    ↓ 归纳
Rule (行为规则)
    ↓ 抽象
Concept (领域概念)
    ↓ 升华
Principle (通用原理)
```

**提取流程**：
1. **提取共同语义特征**：使用 TF-IDF 算法提取高频关键词
2. **识别抽象层级**：
   - `rule`：单一领域，具体行为
   - `concept`：跨领域，中等抽象
   - `principle`：跨领域 + 通用术语，高度抽象
3. **生成概念定义**：基于 TF-IDF 关键词组合
4. **识别适用边界**：适用领域列表、边界条件提取
5. **识别迁移路径**：基于动态学习系统定义目标领域
6. **计算置信度**：验证分数均值(50%) + 多样性(30%) + 样本充足性(20%)

**要求**：
- 最小模式数：≥ 3
- 推荐模式数：5-10
- 验证分数：> 0.75
- 多样性评分：> 0.6

### 2.6 适用性评估 (Applicability)

**目标**：评估洞察在当前具体场景下的可用性和推荐等级。

**评估维度及权重**：
- **时效性 (20%)**：洞察是否过时？
- **相关性 (30%)**：与当前任务/状态的相关性？
- **兼容性 (20%)**：与现有架构/人格的兼容性？
- **资源效率 (15%)**：实施该洞察的资源消耗？
- **风险 (15%)**：应用该洞察的潜在风险？
- **概念匹配 (V2 新增)**：如果是概念抽象，额外评估抽象层级匹配度（占30%，基础70%）

**推荐规则**：
- `score ≥ 0.7` → **推荐应用 (apply)**
- `0.4 ≤ score < 0.7` → **暂缓等待 (wait)**
- `score < 0.4` → **拒绝应用 (reject)**

---

## 3. 信息流约束

### 3.1 合法信息流

| 起点 | 终点 | 数据类型 | 说明 |
|------|------|----------|------|
| **数学顶点** | **认知架构洞察** | 验证后的结构化模式 | 输入源，必须是经过验证的数据 |
| **认知架构洞察** | **映射层** | 策略优化洞察、行为建议、概念 | 指导人格化决策 |
| **认知架构洞察** | **自我迭代顶点** | 架构升级洞察、进化方向 | 指导系统进化 |

### 3.2 禁止信息流 (Critical Constraints)

| 起点 | 终点 | 禁止原因 |
|------|------|----------|
| **认知架构洞察** | **数学顶点** | ❌ **严禁回流**。防止未经验证的洞察污染逻辑推理，破坏因果律 |
| **映射层** | **认知架构洞察** | ❌ 禁止反向指令。洞察模块只输出建议，不接受映射层的直接控制 |
| **自我迭代** | **认知架构洞察** | ❌ 禁止反向指令。进化执行结果应记录在案，供下一次洞察使用 |

---

## 4. 数据存储

所有数据和洞察均存储在 `agi_memory/cognitive_insight/` 目录下。

### 4.1 文件结构

```text
agi_memory/
└── cognitive_insight/
    ├── patterns.json          # 原始模式数据池
    ├── insights.json          # 生成的洞察报告库
    ├── pattern_library.json   # 经筛选的高价值模式库
    └── concept_library.json   # V2 新增，概念库
```

### 4.2 洞察数据格式

```json
{
  "insight_id": "insight_abc123",
  "timestamp": "2026-03-04T10:30:00Z",
  "insight_type": "concept_abstraction",
  "summary": {...},
  "commonality": {...},
  "innovation_basis": {...},
  "applicability": {...},
  "confidence": 0.85,
  "source_patterns": ["pattern_xxx"],
  "version": "2.0",
  "concept": {...}
}
```

---

## 5. 使用示例

### 5.1 基本使用

```python
from cognitive_insight import CognitiveInsightV2

# 初始化
ci = CognitiveInsightV2(memory_dir="./agi_memory")

# 添加模式
ci.add_pattern({
    "pattern_id": "pattern_001",
    "pattern_type": "strategy",
    "description": "在代码生成任务中，先分析需求再生成代码",
    "validation_score": 0.95,
    "domain": "代码生成",
    "occurrence_count": 15
})

# 生成洞察
insight = ci.generate_insight(["pattern_001", "pattern_002", "pattern_003"])

# 查看洞察类型
print(f"洞察类型: {insight['insight_type']}")

# 如果是概念抽象，查看概念数据
if insight.get('insight_type') == 'concept_abstraction':
    concept = insight['concept']
    print(f"概念名称: {concept['concept_name']}")
    print(f"抽象层级: {concept['abstraction_level']}")
```

### 5.2 帮助系统

```python
# 获取帮助信息
help_data = ci.help()

# 打印帮助信息
ci.print_help()

# 运行交互式帮助查看器
# python3 scripts/show_help.py
```

---

## 6. 快速参考

### 6.1 API 快查

| 方法 | 参数 | 返回值 | 用途 |
|------|------|--------|------|
| `add_pattern(pattern)` | pattern: dict | bool | 添加模式 |
| `generate_insight(pattern_ids)` | pattern_ids: List[str] | dict | 生成洞察 |
| `get_insight(insight_id)` | insight_id: str | dict | 获取洞察 |
| `list_insights(limit)` | limit: int | List[dict] | 列出洞察 |
| `record_user_feedback(id, feedback)` | id, feedback | bool | 记录用户反馈 |
| `get_concept_library()` | - | dict | 获取概念库 |
| `get_system_stats()` | - | dict | 获取系统统计 |
| `help()` | - | dict | 获取帮助信息 |

### 6.2 洞察类型优先级

1. **error_correction**（错误纠正）- 最高优先级
2. **architecture_upgrade**（架构升级）- 系统级影响
3. **concept_abstraction**（概念提炼）- 需要多样性>0.6 且验证分数>0.75
4. **strategy_optimization**（策略优化）- 兜底选项

### 6.3 适用性推荐规则

| 推荐等级 | 分数范围 | 建议 |
|---------|---------|------|
| **apply** | ≥ 0.7 | 直接应用 |
| **wait** | 0.4 - 0.7 | 观察等待 |
| **reject** | < 0.4 | 拒绝应用 |

---

## 7. 常见问题 (FAQ)

**Q1: 概念提炼需要多少个模式？**
A: 至少 3 个模式，建议使用 5-10 个模式以提高置信度。

**Q2: 如何提高概念提取的成功率？**
A: 1) 使用更多高质量模式（验证分数 > 0.75）；2) 增加模式来源的多样性；3) 使用跨领域模式。

**Q3: V2 版本是否兼容 V1 的数据？**
A: 是的，V2 完全兼容 V1 的数据格式，可以直接升级。

**Q4: 如何查看帮助信息？**
A: 使用 `ci.help()` 获取结构化帮助数据，或 `ci.print_help()` 打印帮助信息。也可以运行 `python3 scripts/show_help.py` 使用交互式帮助查看器。

**Q5: 适用性评估的推荐等级是如何确定的？**
A: 基于加权总分：apply（≥0.7）、wait（0.4-0.7）、reject（<0.4）。对于概念类型，额外评估抽象层级匹配度。

---

## 8. 更多信息

- **技术实现细节**：参见 `cognitive-insight-v2-implementation.md`
- **快速参考**：参见 `cognitive-insight-quick-reference.md`
- **帮助系统**：运行 `python3 scripts/show_help.py`

---

**版本**: V2.0 | **更新日期**: 2026-03-04 | **协议**: AGPL-3.0