Ai Resource Master

v1.0.2

大模型服务器资源评估。用于医疗行业大模型应用场景的算力资源需求评估和测算,根据门诊/住院诊疗量和大模型应用场景数推导GPU算力需求。使用场景:用户询问大模型算力评估、AI服务器资源配置、GPU算力需求测算等。

0· 179·1 current·1 all-time
Security Scan
VirusTotalVirusTotal
Benign
View report →
OpenClawOpenClaw
Benign
high confidence
Purpose & Capability
技能声明为医疗行业大模型算力评估,所有文档仅涉及收集门诊/住院量与场景列表并按固定公式推导GPU与整机需求;未请求与目的不符的权限、凭证或外部服务。
Instruction Scope
SKILL.md 明确要求向用户收集输入并按给定公式计算结果;没有指示访问系统文件、环境变量或向未说明外部端点传输数据。模板限制(不要使用数学公式/表格)是格式约束而非安全问题。
Install Mechanism
无安装规范、无代码执行、无外部二进制下载——instruction-only,磁盘写入或远程代码拉取风险最低。
Credentials
不要求任何环境变量、凭证或配置路径;所需输入均为用户提供的业务数据(诊疗量、场景、覆盖率、GPU型号等),与技能目的相符。
Persistence & Privilege
技能没有设置 always:true,默认可由模型调用(这是平台常态)。这种自治能力与技能功能匹配且不会扩大权限或持久化到系统。
Assessment
该技能是纯说明性(instruction-only),本身不会安装软件或请求凭证,整体与其“医疗行业大模型算力评估”目的相符。注意事项: - 切勿在交互中提交可识别的患者个人信息(PII/PHI);技能只需要汇总级别的诊疗量和场景覆盖率即可。 - 验证默认假设(如910B3显卡参数、每卡并发10路、华为一体机2.5P等)是否适用于你的实际硬件或供应商;这些是业务假设而非通用真理,应根据你环境调整。 - 在生产决策前用小范围样本数据运行几次计算,确认输出格式和单位(万人次/年、小时、卡数)符合你期望并无四舍五入误差影响重要决策。 - 如果你希望自动化此评估并与真实部署系统对接,注意引入自动化时需单独审查任何新增代码或网络请求。

Like a lobster shell, security has layers — review code before you run it.

latestvk9714tkj2hv494k17msf8cd0y9838ga6
179downloads
0stars
3versions
Updated 1mo ago
v1.0.2
MIT-0

AI大模型服务器资源评估

本技能用于评估医疗行业大模型应用场景的算力资源需求,根据门诊/住院诊疗量和大模型应用场景推导GPU算力需求。

评估流程

第一步:收集必要信息

如果用户未提供以下信息,必须询问:

必备信息:

  1. 地区门诊年诊疗次数(单位:万人次/年)
  2. 地区住院年诊疗次数(单位:万人次/年)
  3. 大模型应用场景列表(从以下选项中选择)

可选信息:

  • 各场景覆盖率(如无提供,使用默认值)
  • 计划使用的GPU型号(如无提供,默认按910B3显卡测算)

第二步:场景定义与参数

大模型应用场景列表

场景名称类型单次占用时间默认覆盖范围
知识问答对话24秒/次按需配置
问诊对话24秒/次按需配置
报告解读对话24秒/次门诊5%
导医导诊对话24秒/次门诊30%
病史采集对话24秒/次按需配置
AI陪诊对话24秒/次按需配置
智能随访对话24秒/次按需配置
病历生成-门诊生成30秒/次门诊100%
病历生成-住院生成50秒/次住院100%
辅助诊断分析50秒/次门诊100%
病历质控-门诊质控40秒/次门诊100%
病历质控-住院质控60秒/次住院100%
诊疗推荐-门诊推荐30秒/次门诊100%
诊疗推荐-住院推荐40秒/次住院100%
报告解读-专用分析20秒/次门诊5%
患者画像提取分析120秒/次门诊+住院100%

场景分类说明

对话类场景(单次24秒):

  • 知识问答、问诊、报告解读(对话类)
  • 导医导诊、病史采集
  • AI陪诊、智能随访

生成类场景

  • 病历生成-门诊:30秒/次
  • 病历生成-住院:50秒/次

分析类场景

  • 辅助诊断:50秒/次
  • 病历质控-门诊:40秒/次
  • 病历质控-住院:60秒/次
  • 诊疗推荐-门诊:30秒/次
  • 诊疗推荐-住院:40秒/次
  • 报告解读-专用:20秒/次
  • 患者画像提取:120秒/次

第三步:算力推导公式

日均调用量计算

日门诊量 = 年门诊量(万人次)× 10000 ÷ 365 日住院量 = 年住院量(万人次)× 10000 ÷ 365

单场景占用时间计算

某场景日占用时间(秒)= 日调用量 × 单次占用时间(秒) 某场景日占用时间(小时)= 日占用时间(秒)÷ 3600

总占用时间汇总

总占用时间(小时)= 所有场景占用时间之和

第四步:算力资源配置

默认配置参数(910B3显卡)

  • 每卡并发路数:10路
  • 单卡日处理时间:10路 × 8小时 = 80小时/卡/日

显卡需求计算

总显卡需求(卡)= 总占用时间(小时)÷ 80小时/卡

一体机配置(华为一体机)

  • 单台一体机卡数:8卡
  • 一体机台数 = 总显卡需求 ÷ 8,向上取整

总算力计算(可选)

如用户需要总算力(P):

  • 单台华为一体机(8卡910B3)算力:2.5P
  • 总算力 = 一体机台数 × 2.5P

输出格式规范

格式要求

  1. 使用普通文档格式,不要使用数学公式
  2. 不要使用表格,正常分行描述
  3. 输出结构清晰,层次分明

标准输出模板

X. 算力资源
X.X 区域大模型算力资源需求评估
X.X.X 模型引擎处理能力测算

服务场景需求背景:
XX地区年均门诊量约XXXX万人次,住院人数约XX万人次。主要服务场景包括:XXX、XXX、XXX等。

日均调用量测算:

(1)场景一名称
- 覆盖率:XX%
- 日调用量:X.XX万次
- 占用时间:X.XX万×XX秒=XXX万秒≈XXX.X小时

(2)场景二名称
- 覆盖率:XX%
- 日调用量:X.XX万次
- 占用时间:X.XX万×XX秒=XXX万秒≈XXX.X小时

[继续列出所有场景...]

X.X.X 总占用时间汇总

各场景占用时间累加:
XXX.X + XXX.X + ... = XXXX.X小时

X.X.X 算力资源配置

- 单卡处理能力(XX显卡):
 - 每卡支持X路并发
 - 单卡日处理时间:X×X = XX小时

- 总显卡需求:
 - XXXX.X小时/XX小时≈XX.X卡
 - 实例配置:XX.X/X≈X.X 台一体机
 - 向上取整 X台一体机

- 总算力(如需要):
 - 单台一体机(X卡)提供X.XP算力
 - X台×X.XP=XX.XP

执行步骤

  1. 信息收集:确认用户提供门诊/住院年诊疗量、选择的大模型场景
  2. 数据计算:按公式计算日调用量、各场景占用时间
  3. 资源推导:计算显卡需求、一体机台数
  4. 格式化输出:按标准模板生成算力评估报告

参考文档

详细的推导参数和示例请参考:

Comments

Loading comments...