# 大模型算力计算参数

## 单场景时间参数

### 对话类场景

所有对话类场景统一按24秒/次计算：

- 知识问答：24秒/次
- 问诊：24秒/次
- 报告解读（对话类）：24秒/次
- 导医导诊：24秒/次
- 病史采集：24秒/次
- AI陪诊：24秒/次
- 智能随访：24秒/次

### 生成类场景

- 病历生成-门诊：30秒/次
- 病历生成-住院：50秒/次

### 分析类场景

- 辅助诊断：50秒/次
- 病历质控-门诊：40秒/次
- 病历质控-住院：60秒/次
- 诊疗推荐-门诊：30秒/次
- 诊疗推荐-住院：40秒/次
- 报告解读-专用：20秒/次
- 患者画像提取：120秒/次

## 默认覆盖率

### 门诊相关场景

- 辅助诊断：100%门诊患者
- 病历质控-门诊：100%门诊患者
- 诊疗推荐-门诊：100%门诊患者
- 病历生成-门诊：100%门诊患者
- 导医导诊：30%门诊患者（估算值）
- 报告解读：5%门诊患者

### 住院相关场景

- 病历质控-住院：100%住院患者
- 诊疗推荐-住院：100%住院患者
- 病历生成-住院：100%住院患者

### 全场景覆盖

- 患者画像提取：100%门诊 + 100%住院患者

## GPU配置参数

### 910B3显卡

- 每卡并发路数：10路
- 单卡日处理时间：10路 × 8小时 = 80小时

### 华为一体机

- 单台卡数：8卡
- 单台算力：2.5P（FP16）

## 计算公式汇总

### 基础数据

日门诊量 = 年门诊量（万人次）× 10000 ÷ 365
日住院量 = 年住院量（万人次）× 10000 ÷ 365

### 单场景计算

日调用量 = 日患者量 × 覆盖率
日占用时间（秒）= 日调用量 × 单次时间（秒）
日占用时间（小时）= 日占用时间（秒） ÷ 3600

### 资源需求

总占用时间 = 所有场景占用时间之和
总显卡需求 = 总占用时间 ÷ 单卡日处理能力
一体机台数 = 总显卡需求 ÷ 单台卡数，向上取整
总算力 = 一体机台数 × 单台算力
