结直肠癌中影响基因功能的遗传与表观遗传变异全面解析
作者: aeks | 发布时间: 2026-03-09 18:03 | 更新时间: 2026-03-09 18:03
结直肠癌(CRC)是一种由大量基因组和表观基因组改变共同驱动的复杂恶性肿瘤。过去研究多聚焦于编码区突变(如APC、KRAS),但全基因组关联研究(GWAS)发现,超过90%的疾病相关变异位于非编码区,提示增强子等调控元件异常在发病中起关键作用。增强子通过染色质环结构精确控制基因时空表达,其活性具有高度组织和细胞类型特异性——同一遗传变异在不同癌症中可能产生截然不同的效应。例如,经典CRC风险位点rs6983267位于MYC基因上游“基因荒漠”区,其G等位基因可招募转录因子TCF7L2,放大Wnt信号促癌;而该增强子在胰腺癌或白血病中却位于MYC下游,凸显其功能的高度组织依赖性。此外,转移过程中增强子常被异常“劫持”,启动子区域甲基化也常沉默抑癌基因。尽管已有报告基因法等技术用于研究非编码变异,但受限于通量,尚缺乏对CRC(尤其是转移阶段)中调控性非编码变异和差异甲基化区域(DMR)的系统性功能注释。
本研究创新性地构建了一套整合性功能基因组学平台:首先,利用ATAC-seq和H3K27ac ChIP-seq数据,在20种癌症中绘制“泛癌增强子图谱”,从而区分出在多种癌症中共有的调控变异与仅在CRC中特异出现的致病变异,优先筛选出CRC背景下的功能候选位点;接着,针对这些位点设计高复杂度寡核苷酸文库,结合两种高通量技术——SNP-STARR-seq(检测SNP等位基因对增强子活性的影响)和Methyl-STARR-seq(检测DNA甲基化对增强子活性的影响),在三种CRC细胞系中开展系统筛查:原发性细胞系HCT116和SW480,以及源自同一患者淋巴结转移灶的转移性细胞系SW620。结果共鉴定出922个在两种原发细胞中均显著影响增强子活性的SNP,以及3136个仅在SW620中起作用的“转移获得型”调控SNP;同时发现487个受甲基化调控的增强子元件在原发细胞中活跃,而在转移细胞中则有3008个甲基化敏感元件出现特异性失调。通过整合Hi-C(三维基因组)、eQTL(表达数量性状位点)和RNA-seq(转录组)等多组学数据,研究人员将这些变异精准锚定至其靶基因,并用CRISPR编辑等实验验证了其生物学功能。
具体机制上,研究发现:(1)SNP rs67941642(与GWAS标志性位点rs6061231完全连锁)能显著增强转录因子GFI1结合,进而上调抑癌基因TAF4表达;敲低TAF4会促进癌细胞增殖与迁移,且TAF4低表达患者5年生存率显著更差,证实其抑癌作用。(2)转移特异性SNP rs1962004的A等位基因(在SW620中为体细胞新发突变)可创建新的JUN/JUND(AP-1复合物组分)结合位点,激活致癌基因LRRC61,促进转移并预示不良预后。(3)甲基化位点cg08640619在CRC肿瘤中特异性高甲基化,导致转录因子RUNX2无法结合,进而抑制邻近抑癌基因KIRREL1和ETV3表达;该位点在临床样本中表现出极强的诊断价值(AUROC > 0.96),是极具潜力的组织早筛标志物。同理,cg25982657也展现出类似优异性能。
综上,本研究不仅首次在CRC中大规模、系统性地解析了非编码遗传与表观遗传变异如何协同破坏转录程序,揭示了从原发到转移的关键调控机制,更提供了可直接转化的早期诊断标志物和潜在治疗靶点。其方法学框架(双STARR-seq+多组学整合)亦可推广至其他癌症,尤其适用于缺乏GWAS数据的癌种(如胰腺癌),为精准肿瘤学研究树立了新范式。