---
name: GWAS分析用于复杂疾病遗传位点发现
description: 该技能执行全基因组关联分析（GWAS），用于在大规模人群队列中无假说驱动地识别与复杂疾病或表型显著相关的常见SNP位点。当研究目标是发现常见复杂疾病的遗传易感位点，且具备患者/对照样本、全基因组SNP数据和明确表型时使用。
---

# GWAS分析用于复杂疾病遗传位点发现

## 何时使用
- 研究目标为无假说驱动地发现常见复杂疾病（如糖尿病、高血压、精神分裂症）的遗传易感位点
- 已有大规模患者与健康对照人群的全基因组SNP基因型数据
- 具备明确、可量化的疾病表型（如诊断状态、生化指标）
- 关注的是常见等位基因变异（次要等位基因频率 > 5%）

## 执行步骤
1. **数据准备**：整合大规模人群（含病例组与对照组）的全基因组SNP基因型数据，并与个体表型信息匹配。
2. **质量控制**：对样本和SNP进行严格质控（如去除低检出率、偏离哈迪-温伯格平衡、低MAF的位点）。
3. **关联分析**：对每个SNP位点执行统计学检验（如卡方检验或逻辑回归），计算其与表型的关联强度及p值。
4. **多重检验校正**：采用全基因组显著性阈值（通常 p < 5×10⁻⁸）筛选显著关联位点。
5. **定位与注释**：确定显著SNP所在的基因组区域，并结合功能注释（编码区、启动子、增强子等）推断潜在致病基因。
6. **后续验证**：通过功能实验、通路富集分析或独立队列重复验证候选基因的作用机制。

> 注意：本方法不适用于罕见突变或结构变异主导的疾病，且对生物信息学能力、数据质量和假阳性控制要求极高。