基因如何从调控到功能再到特征的因果关系揭秘
作者: aeks | 发布时间: 2025-12-14 12:12 | 更新时间: 2025-12-14 12:12
全基因组关联研究(GWAS)和罕见变异负荷测试已发现数万个基因与人类性状的关联,为治疗靶点和疾病机制研究提供了线索,但多数关联的分子机制仍不明确。除了确定相关细胞类型和富集基因集外,我们缺乏全基因组尺度的方法来解析成百上千个基因影响表型的通路。
遗传关联解读的一大挑战是,许多位点通过反式调控其他基因间接发挥作用。泛基因模型指出,任何性状仅由少数“核心基因”直接调控,而更多基因通过基因调控网络中的连接调控核心基因间接影响性状。以往通过反式表达数量性状位点(反式eQTL)和共表达分析研究调控关系,但存在功率低、细胞类型组成干扰或因果关系模糊等局限。
基因编辑和单细胞RNA测序技术(如Perturb-seq)的进步,使在全基因组尺度测量因果基因调控关系成为可能。Perturb-seq通过向细胞池中转导靶向单个基因的sgRNA库,敲低目标基因后进行单细胞测序,可在受控条件下测量每个基因的反式调控效应。
为整合遗传数据与Perturb-seq,研究选择了具有高质量遗传数据且相关细胞类型有Perturb-seq数据的性状。现有全基因组Perturb-seq数据来自白血病细胞系K562(红系祖细胞模型)。通过分层LD分数回归发现,K562开放染色质区域与红细胞相关性状(如平均红细胞血红蛋白量MCH、红细胞分布宽度RDW、未成熟网织红细胞比例IRF)的遗传力显著富集,故选取这些性状深入研究。
在构建因果模型前,分析了这些性状的遗传关联。MCH的GWAS识别634个显著信号,富集于血红素代谢、造血和细胞周期等通路;LoF负荷测试识别90个相关基因,与GWAS富集通路一致。使用GeneBayes框架优化LoF效应量估计,提高了准确性和可重复性。
进一步发现,K562的Perturb-seq数据可解释遗传关联。例如,血红蛋白基因HBA1的LoF对MCH影响大,调控HBA1的基因也与MCH相关,且调控效应方向与LoF效应一致。相比GWAS,LoF负荷测试信号与调控效应的相关性更强。
将基因表达数据聚类为“程序”(功能相关基因集),发现血红蛋白合成、细胞周期、自噬等程序与性状相关。程序基因和调控因子的效应方向有时一致,有时因调控网络复杂性而不一致,反映了程序间的相互作用(如细胞周期各阶段的协同调控)。
构建了基因-程序-性状因果图,整合了核心调控通路(如祖细胞维持、血红蛋白合成、自噬、细胞周期),解释了基因对性状的影响机制(如SUPT5H通过调控多个程序影响MCH)。该模型还揭示了不同血液性状间共享和独立的调控通路。
综上,结合LoF负荷测试与Perturb-seq数据,可构建解释基因如何通过调控通路影响性状的因果模型。未来更多性状相关细胞类型的Perturb-seq数据将为人类遗传学提供关键解读框架。