# 客观热点分析框架

## 目标

把“什么最热”与“谁对谁错”拆开，只做热点强度判断，不做立场裁决。

## 分析流程

1. 统一多平台字段。
2. 计算每条记录的讨论、传播、转发、情绪、对立和时效性信号。
3. 识别广告、抽奖、引流、搬运、低信息密度内容并做去噪惩罚。
4. 聚合同一事件的不同标题和不同平台版本。
5. 计算聚类后的综合热点分并输出默认 Top10。

## 单条记录指标

### 讨论度

```text
讨论度 = 评论量 + 回复量 + 问答量
```

优先体现“有人在认真讨论”，而不是只看点赞。

### 传播度

```text
传播度 = 曝光量 + 阅读量/播放量 + 增量信号
```

优先体现“触达面”和“扩散速度”。

### 转发度

```text
转发度 = 转发 + 分享 + 收藏
```

收藏可视为弱转发信号，适合作为补充指标。

### 情绪强度

优先顺序：

1. 直接使用 `emotion_intensity`
2. 使用正负向评论占比推导
3. 用评论密度与转发密度做弱估计

### 对立程度

优先顺序：

1. 直接使用 `opposition_score` 或 `controversy_score`
2. 使用支持/反对数量平衡度推导
3. 使用正负向评论接近程度推导

高对立不等于高质量，只表示争议更强。

## 聚类规则

同一事件满足以下任一条件即可合并：

- `event_id` 相同
- 标题归一化后高度相似
- 关键词集合高度重叠
- 一长一短标题明显指向同一事件

聚类后必须使用中性名称作为 `neutral_topic`。

## 去噪规则

以下信号会导致降权或过滤：

- 广告、促销、领券、福利、抽奖
- 私信引流、外部导流、加群加微
- 纯情绪宣泄、无事实支撑
- 明显标题党或信息密度过低
- 重复搬运和模板化刷屏

## 综合热点分

```text
综合热点分 = 讨论度 × 0.26
          + 传播度 × 0.24
          + 转发度 × 0.18
          + 时效性 × 0.12
          + 情绪强度 × 0.10
          + 对立程度 × 0.10

综合热点分 = 综合热点分
          × 跨平台覆盖修正
          × 客观性保护系数
          × (1 - 去噪惩罚)
```

## 客观性保护系数

客观性保护系数用于避免被单平台极端情绪带偏，主要受以下因素影响：

- 平台覆盖数
- 证据条目数
- 是否只来自单一叙事
- 是否存在明显噪音主导

来源越多、证据越平衡、噪音越低，系数越高。

## 输出约束

- 默认只给热点排行和解释，不主动扩展成内容脚本。
- 对高争议话题，写“存在明显对立观点”，不要写“某方显然正确”。
- 对高噪音话题，保留但要明确标注降权原因。
- 对低证据话题，降低置信度并说明原因。
