“中国千人泛基因组”助力医学研究与人群遗传学

作者: aeks | 发布时间: 2026-04-02 03:02 | 更新时间: 2026-04-02 03:02

学科分类: 临床医学 基础医学 生物工程

“中国千人泛基因组”助力医学研究与人群遗传学
“中国千人泛基因组”助力医学研究与人群遗传学

本文介绍了“1000中国泛基因组”(1KCP)项目的重要成果。传统人类参考基因组(如GRCh38)仅基于少数个体构建,难以全面反映人群遗传多样性,尤其在检测大型复杂变异(如结构变异SV、串联重复TR)方面存在明显局限。为此,研究团队对1116名中国志愿者进行了高深度短读长与长读长测序,并创新性地采用“泛基因组引导的基因组组装”(PIGA)流程,成功构建了高质量二倍体基因组组装。基于这些数据,团队构建了迄今最全面的中国人群泛基因组图谱,其中新增了4.05亿碱基对(bp)未被现有参考基因组覆盖的序列,包括2620万bp的功能性基因区和调控元件。该图谱系统收录了3540万个微小变异、11万个结构变异、48.5万个串联重复位点及86万个嵌套变异(即存在于非参考序列中的新变异)。研究进一步发现,这些复杂变异显著影响基因表达:例如,某些结构变异可直接破坏基因编码区;某些串联重复序列的扩增与神经退行性疾病等密切相关;血红蛋白结合蛋白(HP)基因簇存在多种结构单倍型,与血脂水平显著关联;人类白细胞抗原(HLA)基因的四字段分型精度大幅提升,揭示了更精细的连锁不平衡结构。此外,团队还开发了支持多类型变异联合分析的表达数量性状基因座(eQTL)分析方法,发现了3256个由复杂变异驱动的调控信号;并建立了首个面向多类型变异的全基因组填补(imputation)参考面板,显著提升了后续关联分析的分辨率。总之,1KCP项目不仅极大丰富了人类泛基因组资源,更从医学和群体遗传学角度,为理解复杂变异的功能意义、推动精准健康提供了坚实基础。

DOI: 10.1038/s41586-026-10315-y

标签: 中国人群 串联重复序列 泛基因组 结构变异 表达数量性状基因座