基因与环境如何相互影响:跨人群综合指南
作者: aeks | 发布时间: 2026-01-30 14:03 | 更新时间: 2026-01-30 14:03
人类遗传学尤其是全基因组关联研究(GWAS)在揭示疾病病理生理和复杂性状生物学方面取得了巨大成功。多组学层面的遗传关联分析已覆盖蛋白质组学、代谢组学和单细胞RNA测序,为性状相关基因位点提供了细致见解。但这些研究聚焦于固定的遗传效应(更准确地说是边际效应),过度简化了性状生物学的内在复杂性。本质上,人类表型会随多因素环境暴露(包括性别、衰老和生活方式)发生显著变化。个体对环境反应的异质性由遗传适应塑造,并影响当前疾病风险和药物疗效。从遗传学角度,这种表型可塑性表现为遗传效应大小随环境因素变化(或环境效应随基因型变化),即基因-环境(G×E)互作。G×E互作捕捉遗传效应的动态变化,揭示表型可塑性的遗传调控。在某些性状中,G×E互作研究已开始解释边际效应未捕捉到的表型变异(即遗传力缺失)和多基因风险预测的差异。因此,识别G×E互作可能有助于减少健康差异并精准实施精准医疗。
然而,经过数十年努力,人类中已确立的G×E互作数量有限,其生物学解释仍不充分。过去的研究因统计 power 低、多重检验负担重、遗传变异筛选随意以及部分统计检验不精确等原因,复制率较低。G×E互作仅在有限的性状和环境中进行了大规模研究,且主要集中在欧洲人群。因此,跨表型、环境和人群的G×E互作全局概览仍未知。
在此,利用近期出现的人群规模生物样本库和计算高效方法,我们使用英国生物样本库(UKB)和日本生物样本库(BBJ)进行了平行全基因组G×E互作研究,提供了跨人群的G×E互作图谱。我们在四个不同人群的独立队列中验证了已识别的G×E互作,注释了环境贡献者,并评估了它们对遗传力、多基因预测准确性和相关细胞类型的影响。多组学G×E分析为临床G×E互作提供了分子见解。这些多分辨率分析表明,G×E互作在调节动态表型可塑性中起关键作用,为个性化表型预测和药物研发提供信息。
为可靠检测G×E互作,我们将UKB和BBJ分为发现队列和复制队列。针对38种生物标志物和9种疾病(涵盖10个类别),我们单独和联合测试了九种环境因素的G×E互作,并通过柯西分布聚合每个变异的P值以评估全基因组显著性。环境因素包括年龄、性别、饮酒史、吸烟史、当前吸烟状况,以及从问卷数据中得出的饮食和体育活动的四个聚类。
在UKB1中,我们在45个位点发现了64个全基因组显著的G×E互作,经Bonferroni校正后仍有23个位点的31个互作显著,表明G×E互作在人类复杂性状中广泛存在。其中包括已知的互作,如HYKK基因座与当前吸烟对体重指数(BMI)的互作、UMOD基因座与年龄对估算肾小球滤过率(eGFR)的互作等,实证验证了我们的结果。其余互作在GWAS Catalog中未以G×E P<5.0×10⁻⁸的水平报道。在BBJ1中,检测到15个位点的36个显著G×E互作(Bonferroni校正后为8个位点的26个),包括在欧洲人群中已确立的FTO基因座与BMI的互作(由G×年龄和G×饮酒史驱动),强调了在非欧洲人群中研究G×E互作的重要性。值得注意的是,58%的G×E互作位于ALDH2基因座,该基因座携带东亚特异性错义变异(rs671),对酒精代谢有强烈显性效应。
UKB1的64个G×E互作中,23个在UKB2中名义上复制,6个经Bonferroni校正后显著;BBJ中36个互作中的28个名义上复制,19个在BBJ2中显著。我们进一步在独立队列(All of Us的欧洲人群、日本J-MICC/HERPACC和JPHC队列)中测试复制,Bonferroni复制率在All of Us中为27%,在J-MICC/HERPACC中为56%,ALDH2基因座的多效性G×E互作在J-MICC/HERPACC中复制率达81%。
合并UKB和BBJ结果得到54个位点的94个性状-位点对,6个位点在两个生物样本库中共享,通常涉及目标表型的核心基因。排除ALDH2基因座后,73个互作中的22个在跨人群中名义复制,9个显著复制,保守的信号共享估计为0.41,表明G×E互作在人群间有中等一致性。跨人群复制的位点包括APOE基因座与年龄对总胆固醇的互作等。
G×E互作可通过揭示环境特异性遗传关联增强基因座解释。在UKB1中,饮食相关环境导致5个G×E互作,均至少名义复制,如ABCG2基因座与eGFR的关联特定于“肉类和奶酪”非消费者。在BBJ1中,ALDH2基因座的多效性G×E互作在调整G×饮酒互作后仍受多种环境影响,分层分析显示12种生物标志物在饮酒者中显示强非加性效应,4种造血性状在非饮酒者中显示纯加性效应。
在BBJ1中,PITX2基因座与心律失常的G×E互作主要由纳豆(发酵大豆)摄入驱动。rs72900155变异与心房颤动相关,临床上华法林(长期抗凝药)可能连接纳豆和心房颤动,因纳豆中的维生素K会降低华法林抗凝效果,患者被建议避免食用。同一患者在华法林开始使用后纳豆摄入量显著下降,表明此G×E互作由疾病到环境的反向因果关系驱动。BBJ2中该互作未复制,因BBJ2招募期间直接口服抗凝药(DOACs)取代华法林,DOACs无需限制纳豆摄入。
全基因组G×E遗传力评估显示,在UKB1和BBJ1中分别有14和12个性状-环境对显著,聚合环境后,UKB1有7个性状、BBJ1有11个性状的G×E遗传力显著为正,包括身高、BMI、高密度脂蛋白胆固醇(HDL-C)和舒张压(DBP)四个重叠性状。BMI的G×E与边际遗传力比率远高于身高,表明 anthropometric 性状在人群间有共享的G×E结构。跨性状G×E相关分析显示,G×E相关按性状类别聚类,且相同环境因素在人群间介导G×E相关,如当前吸烟与肝脏相关性状、性别和饮食与血压性状等。
过去研究常通过预筛选变异(如方差数量性状位点vQTL)减少多重检验负担,但vQTL遗漏了大部分G×E互作,且其遗传力与G×E遗传力不相关,强调明确使用环境数据进行全面G×E检测的必要性。
多基因评分(PGS)疾病风险预测受环境差异影响,降低特定性状预测准确性。在26个具有显著G×E遗传力的性状-环境-生物样本库三元组中,20个在至少一个分层中显示显著的群体内预测准确性差异,预测准确性在PGS构建的相同环境组中最高。基于G×E互作构建的多基因评分(G×E-PGS)在独立队列中显著解释表型变异,如BBJ1构建的G×性别PGS在J-MICC/HERPACC中成功按性别相反方向分层BMI,模型加入G×E-PGS后BMI预测准确性提高16%。
以脉压的G×年龄互作为例,跨人群基因集分析显示血管平滑肌收缩在年轻人中富集,细胞衰老在老年人中富集。单细胞投射显示,脉压遗传效应在年轻人中与平滑肌细胞相关,在老年人中与冠状动脉内皮细胞亚群相关,表明脉压遗传学的年龄相关变化由收缩压对舒张压影响增加驱动,反映从青年平滑肌介导调节到老年内皮驱动收缩压升高的转变。
多组学G×E分析鉴定了13个显著蛋白质-基因座对和2326个显著代谢物-基因座对,70%的位点存在组学水平G×E互作,且相同环境驱动临床和组学G×E互作。代谢物G×E互作显示五种模式,其中第二种模式中,86%的G×E代谢物QTL的主要贡献者为性别,如CETP基因座对LDL中甘油三酯百分比(LDL_TG_pct)的G×E特异性信号,效应方向因性别而异,LDL_TG_pct预测男女全因和冠心病死亡率,提示CETP抑制可能降低男性LDL_TG_pct但增加女性,可能解释临床试验失败。TNFAIP8基因座显示双峰P值分布,边际效应主要通过甘油三子亚组分,多个HDL代谢物显示性别差异效应。
总之,我们提供了跨基因组、表型组和环境的G×E图谱,在两个人群中测试并在多样人群中复制,显著扩展了人类G×E互作目录。利用该图谱,我们展示了G×E互作在基因座、全基因组、单细胞和分子水平提供精细和整体的生物学动态见解,强调了G×E互作在解码复杂性状生物学动态、完善精准医疗和指导药物研发中的重要性。