# Query Patterns — 4 类查询生成规则详解

本文档是 query-planner 的核心参考。每类查询包含：定义、适用场景、生成模板、正例、反例。

---

## 1. identity_queries — 身份与定义

### 定义
回答"主对象是什么"，建立分析的认知基础。

### 适用场景
- 主对象是未知实体（如"SEPI 协议"、"CXL 标准"）
- 需要确认实体分类（人/组织/技术/概念）
- 分析前需要建立基准知识

### 生成规则
- 聚焦主对象的 **本质定义**、**归属分类**、**关键属性**
- 可包含 1 条关于主对象"上游/下游关系"的 query（如技术栈位置、产业链环节）
- 不涉及动态事件或价值判断

### 模板

| 模板 | 适用 | 示例 |
|------|------|------|
| `"{subject} 定义 是什么 概念解析"` | 通用 | `"CXL 标准定义 是什么 概念解析"` |
| `"{subject} 背景 历史 发展历程"` | 有历史纵深 | `"台积电 背景历史 发展历程"` |
| `"{subject} 分类 类别 定位"` | 需要分类框架 | `"开源许可证 分类 类别 对比"` |
| `"{subject} 核心特征 关键指标"` | 可量化对象 | `"GPT-4 核心特征 参数量 性能指标"` |
| `"{subject} 上游 下游 产业链关系"` | 产业分析 | `"ASML 上游供应商 下游客户 产业链"` |

### 正例
```
"华为海思 芯片设计能力 定义 核心产品线"
"RISC-V 指令集 开源架构 国际生态"
```

### 反例（禁止）
```
"华为海思为什么被制裁"           ← 这是 event/action，不是 identity
"RISC-V是不是比ARM好"            ← 价值判断，query-planner 不做判断
"请告诉我关于芯片的一切"          ← 过于宽泛，不可搜索
```

### 数量：2–5 条

---

## 2. event_queries — 事件与数据

### 定义
回答"发生了什么"，捕获时间线、因果关系、关键数据点。

### 适用场景
- 需要梳理事件脉络（制裁时间线、政策演进、技术迭代）
- 需要量化数据支撑分析（市场份额、增长率、性能数据）
- 因果分析需求（A 事件导致 B 结果）

### 生成规则
- 若有 `canonical_time_frame`，**必须**在 ≥50% 的 query 中体现时间词
- 若有 `target_variable`，**必须**在至少 1 条 query 中包含该变量
- 覆盖"是什么时候""有多少""导致了什么"三个维度
- 优先使用具体数据词（"增长率""份额""数量""金额"）而非模糊词（"影响""变化"）

### 模板

| 模板 | 适用 | 示例 |
|------|------|------|
| `"{subject} {time_frame} 重大事件 时间线"` | 事件梳理 | `"华为 2019-2024 制裁事件 时间线"` |
| `"{subject} {time_frame} 数据 统计 市场份额"` | 量化数据 | `"中国半导体 {2023-2024} 产值 进口额 统计"` |
| `"{subject} {time_frame} 因果关系 影响 链条"` | 因果分析 | `"芯片禁令 2022-2023 全球供应链 影响"` |
| `"{subject} {variable} 变化趋势"` | 有 target_variable | `"台积电 营收 2024 季度变化趋势"` |
| `"{subject} 里程碑 关键节点 转折点"` | 历史梳理 | `"OpenAI 关键里程碑 GPT迭代时间线"` |

### 正例
```
"台积电 2024 季度营收 全球晶圆代工市场份额"
"美国芯片出口管制 2022-2024 政策演进时间线"
"中国半导体自给率 2020-2024 变化趋势"
```

### 反例（禁止）
```
"台积电最近怎么样了"              ← 模糊，不可搜索
"芯片禁令对中国的影响是好是坏"      ← 价值判断
```

### 数量：3–8 条

---

## 3. action_queries — 决策与行动

### 定义
回答"做了什么/该做什么"，捕获政策、战略、干预措施、竞争策略。

### 适用场景
- 评估政策效果
- 分析企业/国家战略
- 对比不同行动方案
- 寻找最佳实践

### 生成规则
- 聚焦 **具体行动**（政策名称、法案编号、战略计划名称）
- 若有 `target_variable`，纳入至少 1 条关于该变量的行动/干预 query
- 可合理扩展到主对象的竞争对手、对标案例
- 使用具体名词（法案名、计划名、项目名）而非泛化动词

### 模板

| 模板 | 适用 | 示例 |
|------|------|------|
| `"{subject} 政策 法规 管制措施"` | 政策分析 | `"美国 对华芯片出口 政策 法规 管制措施"` |
| `"{subject} 战略计划 发展路线图"` | 战略分析 | `"中国半导体 大基金 发展战略 三期投资"` |
| `"{subject} 对标 竞争对手 最佳实践"` | 竞争分析 | `"三星vs台积电 先进制程 对标 竞争策略"` |
| `"{subject} 干预措施 效果评估"` | 政策评估 | `"芯片补贴政策 效果评估 ROI"` |
| `"{subject} {variable} 提升措施 行动计划"` | 有 target_variable | `"国产芯片 自给率 提升措施 行动计划"` |

### 正例
```
"CHIPS Act 美国芯片法案 具体条款 补贴额度 落地进展"
"中国集成电路大基金三期 投资方向 金额 重点企业"
"日本韩国 半导体出口管制 2023 对华限制措施"
```

### 反例（禁止）
```
"各国应该怎么做"                  ← 泛化建议，query-planner 不给建议
"怎么发展半导体"                  ← 过于宽泛
```

### 数量：2–6 条

---

## 4. counter_queries — 反面证据（强制）

### 定义
质疑主线叙事，寻找冲突数据、替代解释、被忽略的视角、失败案例。

### 适用场景
- **所有任务**（无例外）
- 分析可能存在幸存者偏差
- 政策/战略效果需要验证
- 技术对比需要看到缺点
- 数据可能被操纵

### 生成规则
- **数量绝对不为 0**（最少 2 条）
- 覆盖至少 3 个质疑维度（从以下选）：
  1. **数据质疑**：数据来源是否可靠？有没有被操纵的嫌疑？
  2. **替代解释**：同一现象有没有其他解释？
  3. **失败案例**：有没有类似的失败先例？
  4. **利益冲突**：信息发布方是否有利益相关？
  5. **时间偏差**：结论是否只是短期现象？长期趋势是否相反？
  6. **范围谬误**：结论是否被不当推广到更大范围？
- 使用否定词/质疑词（"质疑""争议""失败""泡沫""高估""低估"）

### 模板

| 模板 | 适用 | 示例 |
|------|------|------|
| `"{subject} 质疑 争议 问题"` | 通用反面 | `"中国半导体 自研能力 质疑 争议"` |
| `"{subject} 失败案例 教训"` | 历史反面 | `"芯片国产化 失败案例 历史教训"` |
| `"{subject} 数据真实性 造假 夸大"` | 数据质疑 | `"某公司 营收数据 真实性 质疑"` |
| `"{subject} 泡沫 高估 回调风险"` | 过热质疑 | `"AI芯片 需求泡沫 估值高估"` |
| `"{subject} 替代方案 不同观点 反对意见"` | 观点对立 | `"RISC-V 替代ARM 不同观点 局限性"` |
| `"{subject} 利益相关方 偏见 宣传"` | 利益冲突 | `"ASML 中国市场数据 利益相关 偏见"` |

### 正例
```
"中国芯片自给率统计 数据口径 争议 质疑"
"半导体产业补贴 政策效果 高估 国际经验反面案例"
"AI算力需求 泡沫论 数据中心过剩风险"
```

### 反例（禁止）
```
"这个主题没有反面证据"            ← 不允许，必须找到反面角度
"反面证据不重要"                 ← 不允许跳过
```

### 数量：**2–5 条，强制 ≥ 2**

---

## 全局约束速查

| 规则 | 约束 |
|------|------|
| 分类数量 | 恰好 4 类，禁止新增 |
| counter 最少 | ≥ 2 条，零容忍 |
| query 形式 | 可直接搜索的关键词短语 |
| 主对象聚焦 | 默认围绕 primary_subject |
| 时间绑定 | 有 time_frame 时 event+action 的 ≥50% 包含时间词 |
| 变量渗透 | 有 target_variable 时 event+action 各 ≥1 条包含 |
| 去重 | 同输出内禁止语义重复 |
| 总量控制 | 4 类合计 9–24 条（建议 12–18 条） |
