# 数据置信度说明

## 数据来源与可靠性

### 高置信度数据（可直接使用）
| 数据类型 | 来源 | 置信度 |
|---------|------|--------|
| 搜索结果数量 | 搜索引擎返回 | 95%+ |
| 平台标识 | 搜索结果URL | 90%+ |
| 标题信息 | 搜索结果标题 | 95%+ |
| 摘要内容 | 搜索结果摘要 | 85%+ |

### 中置信度数据（需要验证）
| 数据类型 | 来源 | 置信度 | 说明 |
|---------|------|--------|------|
| 互动数据 | 摘要中提取 | 60-80% | 可能有偏差 |
| 发布时间 | 搜索结果显示 | 50-70% | 部分不显示 |
| 搜索频率等级 | 估算 | 70-85% | 基于结果数量估算 |

### 低置信度数据（仅供参考）
| 数据类型 | 来源 | 置信度 | 说明 |
|---------|------|--------|------|
| 热度持续性 | 推断 | 40-60% | 基于有限信息推断 |
| 精确互动数值 | 摘要片段 | 30-50% | 可能不完整 |

## 数据标注规范

### 置信度标识

| 标识 | 含义 | 使用场景 |
|------|------|---------|
| ✅ 已验证 | 数据来自可靠来源 | 搜索结果明确显示 |
| ⚠️ 待验证 | 数据需要进一步确认 | 摘要中提取的片段 |
| 📊 估算值 | 基于有限信息估算 | 搜索频率等级 |
| ❓ 未知 | 数据无法获取 | 发布时间等缺失字段 |

### 标注示例

```
| 字段 | 值 | 置信度 |
|------|-----|--------|
| 标题 | 成都周边这5个露营地... | ✅ 已验证 |
| 收藏数 | 1.2w | ⚠️ 待验证 |
| 搜索频率 | 🔥🔥🔥高频 | 📊 估算值 |
| 发布时间 | - | ❓ 未知 |
```

## 数据局限性说明

### 搜索工具局限
1. **无法获取实时数据**：数据是搜索时点的快照
2. **部分平台数据受限**：小红书、抖音等平台数据难以精确获取
3. **互动数据不完整**：搜索摘要可能只显示部分数据
4. **发布时间缺失**：部分搜索结果不包含发布时间

### 建议补充方案
1. **手动验证**：点击链接查看原文确认数据
2. **多源对比**：使用多个搜索词交叉验证
3. **第三方工具**：使用新榜、千瓜等专业数据平台
4. **定期更新**：热点话题数据变化快，建议定期更新

## 数据使用建议

### 高置信度数据
- 可直接用于报告和分析
- 可作为创作决策依据

### 中置信度数据
- 建议交叉验证后使用
- 作为趋势参考，不建议精确引用

### 低置信度数据
- 仅作趋势判断参考
- 不建议用于精确分析
- 需要补充验证后使用
