# 时间窗场景示例

## 概述

不同类型任务对证据新鲜度的要求差异极大。本文档定义了常见场景的典型时间窗，并展示边界案例的处理方式。

---

## 1. 突发新闻场景

### 典型时间窗

| 参数 | 值 |
|------|-----|
| **时间窗** | 过去 24 小时 |
| ** granularity** | hour |
| **stale_threshold** | 72 小时 |
| **conservatism_level** | high |
| **undated_handling** | downrank |

### 分类逻辑

```
时间轴（以当前时间 2024-05-15 14:00 为基准）：

<--- stale ---|--- background ---|--- current (24h) ---|--- now
              |                  |                     |
           -72h               -24h                  0h
        2024-05-12          2024-05-14            2024-05-15
```

### 边界案例

| 证据时间 | 距现在 | 分类（保守） | 说明 |
|----------|--------|-------------|------|
| 2024-05-15 10:00 | 4h | Current | 在窗内 |
| 2024-05-14 22:00 | 16h | Current | 在窗内 |
| 2024-05-14 13:00 | 25h | Background | 刚出窗 |
| 2024-05-13 08:00 | 54h | Background | 窗外近期 |
| 2024-05-11 20:00 | 66h | Stale | 接近 stale 阈值 |
| 2024-05-10 00:00 | 86h | Stale | 超过 stale 阈值 |
| 无时间 | — | Undated | — |

### 实际示例

```
任务：分析"2024年5月15日OpenAI发布GPT-5"的最新影响
canonical_time_frame: 2024-05-14T14:00 ~ 2024-05-15T14:00

证据1: "2024年5月15日10:00 — OpenAI正式发布GPT-5，股价盘后上涨3.2%"
  → Current ✅

证据2: "2024年5月14日20:00 — 媒体提前泄露GPT-5发布消息，社区反应热烈"
  → Current ✅（在窗内）

证据3: "2024年5月14日09:00 — OpenAI发布WWDC预告，暗示将公布新产品"
  → Background（25小时前，超出时间窗）

证据4: "2024年5月12日 — OpenAI宣布GPT-4 Turbo降价50%"
  → Stale（86小时前，超过72h阈值）

证据5: "据业内人士透露，GPT-5性能远超预期"
  → Undated（无时间信息）
```

---

## 2. 政策分析场景

### 典型时间窗

| 参数 | 值 |
|------|-----|
| **时间窗** | 过去 30 天 |
| ** granularity** | day |
| **stale_threshold** | 6 个月 |
| **conservatism_level** | standard |
| **undated_handling** | flag_only |

### 分类逻辑

```
时间轴（以当前时间 2024-05-15 为基准）：

<--- stale ---|--- background ---|--- current (30d) ---|--- now
              |                  |                     |
           -6个月              -30天                  0h
        2023-11-15          2024-04-15            2024-05-15
```

### 边界案例

| 证据时间 | 距现在 | 分类 | 说明 |
|----------|--------|------|------|
| 2024-05-10 | 5天 | Current | 在窗内 |
| 2024-05-01 | 14天 | Current | 在窗内 |
| 2024-04-20 | 25天 | Current | 在窗内 |
| 2024-04-14 | 31天 | Background（标准）/ Current（宽松） | 窗边界 |
| 2024-03-01 | 75天 | Background | 窗外近期 |
| 2024-01-01 | 135天 | Background | 窗外中期 |
| 2023-11-10 | 186天 | Stale | 超过6个月 |
| 2023-06-01 | 349天 | Stale | 远超阈值 |

### 特殊规则

政策类证据需要额外检查**政策生效状态**：

```
即使发布时间很久远，如果政策当前仍然有效：
- "2021年颁布的《数据安全法》目前仍然有效" → Background（非Stale）
- "2020年发布的《个人信息保护法》于2021年11月1日生效" → Background（长期有效法规）

如果政策已被修订或废止：
- "2021年版《网络安全审查办法》规定..." → Stale（2022年已修订）
- "2024年5月1日起实施的XX新规..." → Current（在窗内且为最新版本）
```

### 实际示例

```
任务：分析中国AI监管政策的最新动态
canonical_time_frame: 2024-04-15 ~ 2024-05-15

证据1: "2024年5月1日起，中国实施《生成式人工智能服务管理暂行办法》修订版"
  → Current ✅

证据2: "2024年4月28日，网信办发布AI生成内容标识新规征求意见稿"
  → Current ✅

证据3: "2024年3月15日，国务院发布《关于加强人工智能伦理治理的指导意见》"
  → Background（31天前，标准模式标记为Background）

证据4: "2023年8月，中国发布全球首部生成式AI管理办法"
  → Background（政策历史，仍有效，有参考价值）

证据5: "2022年12月，网信办等三部门联合发布《互联网信息服务深度合成管理规定》"
  → Background（已生效法规，可作为法律基础引用）

证据6: "2020年1月，网信办发布《网络信息内容生态治理规定》"
  → Stale（超过6个月，且与AI主题关联度较低）
```

---

## 3. 技术趋势场景

### 典型时间窗

| 参数 | 值 |
|------|-----|
| **时间窗** | 过去 6 个月 |
| ** granularity** | month |
| **stale_threshold** | 18 个月 |
| **conservatism_level** | lenient |
| **undated_handling** | downrank |

### 分类逻辑

```
时间轴（以当前时间 2024-05-15 为基准）：

<--- stale ---|--- background ---|--- current (6个月) ---|--- now
              |                  |                     |
          -18个月              -6个月                  0h
        2022-11-15          2023-11-15            2024-05-15
```

### 边界案例

| 证据时间 | 距现在 | 分类 | 说明 |
|----------|--------|------|------|
| 2024-05-01 | 14天 | Current | 在窗内 |
| 2024-03-01 | 75天 | Current | 在窗内 |
| 2024-01-01 | 135天 | Current | 在窗内 |
| 2023-11-20 | 177天 | Background（保守）/ Current（标准/宽松） | 窗边界 |
| 2023-09-01 | 257天 | Background | 窗外近期 |
| 2023-06-01 | 349天 | Background | 窗外中期 |
| 2022-11-10 | 552天 | Stale | 超过18个月 |

### 特殊规则

技术类证据需要额外检查**版本迭代状态**：

```
即使发布时间在窗内，如果技术已被新版本替代：
- "GPT-4在代码生成方面表现优异"（发表于2024-04，但GPT-5已发布）
  → Background（技术已被迭代，但仍有一定参考价值）

技术架构/原理类证据不受版本迭代影响：
- "Transformer架构使用自注意力机制"（发表于2022年）
  → Background（基础原理，不受时间影响）
```

### 实际示例

```
任务：调研大语言模型技术发展趋势
canonical_time_frame: 2023-11-15 ~ 2024-05-15

证据1: "2024年5月，OpenAI发布GPT-5，支持500K上下文窗口"
  → Current ✅

证据2: "2024年3月，Anthropic发布Claude 3，在多项基准测试中超越GPT-4"
  → Current ✅

证据3: "2024年1月，Google发布Gemini Ultra，声称超越GPT-4"
  → Current ✅

证据4: "2023年11月，OpenAI发布GPT-4 Turbo，支持128K上下文"
  → Background（宽松模式可标记Current，但GPT-5已发布）

证据5: "2023年3月，GPT-4发布，标志着大语言模型进入多模态时代"
  → Background（里程碑事件，有历史参考价值）

证据6: "2022年11月，ChatGPT发布，引发全球AI热潮"
  → Background（历史节点，提供趋势背景）

证据7: "2021年1月，OpenAI发布DALL·E，开创AI图像生成时代"
  → Stale（超过18个月，且非语言模型领域）

证据8: "某开源项目在GitHub上获得10万star"
  → Undated（无时间信息，无发布日期）

证据9: "2024年2月30日，Meta发布Llama 3"
  → Malformed（2月没有30日）

证据10: "据知情人士透露，Google将在'今年'发布下一代模型"
  → Undated（"今年"无法确定具体年份）
```

---

## 4. 历史研究场景

### 典型时间窗

| 参数 | 值 |
|------|-----|
| **时间窗** | 过去 5 年 |
| ** granularity** | year |
| **stale_threshold** | 20 年 |
| **conservatism_level** | lenient |
| **undated_handling** | flag_only |

### 分类逻辑

```
时间轴（以当前时间 2024-05-15 为基准）：

<--- stale ---|--- background ---|--- current (5年) ---|--- now
              |                  |                    |
          -20年               -5年                  0h
        2004-05-15          2019-05-15           2024-05-15
```

### 特殊规则

- 历史事件的时间窗通常很宽泛
- "stale" 在历史研究中通常意味着信息已被新考古发现或学术研究推翻
- Undated 的历史证据在宽松模式下可接受，但需添加 Warning

---

## 5. 市场分析场景

### 典型时间窗

| 参数 | 值 |
|------|-----|
| **时间窗** | 过去 90 天 |
| ** granularity** | week |
| **stale_threshold** | 12 个月 |
| **conservatism_level** | standard |
| **undated_handling** | downrank |

### 特殊规则

- 财报数据：当前季度财报 → Current，上一季度 → Background，去年 → Stale
- 股价数据：市场数据时效性极强，24小时外的股价数据对短期分析可能已 Stale
- 行业预测：发布于窗内 → Current，发布于窗外但预测时间覆盖窗内 → Background

---

## 6. 快速参考表

| 场景 | 时间窗 | stale阈值 | 保守度 | undated处理 |
|------|--------|-----------|--------|-------------|
| 突发新闻 | 24h | 72h | high | downrank |
| 政策分析 | 30天 | 6个月 | standard | flag_only |
| 技术趋势 | 6个月 | 18个月 | lenient | downrank |
| 市场分析 | 90天 | 12个月 | standard | downrank |
| 历史研究 | 5年 | 20年 | lenient | flag_only |
| 学术调研 | 2年 | 10年 | standard | flag_only |
| 产品评测 | 3个月 | 12个月 | standard | downrank |
| 舆情监测 | 48h | 2周 | high | downrank |
