机器学习揭示糖蛋白相互作用与“镜像”分子识别

作者: aeks | 发布时间: 2025-12-14 10:35 | 更新时间: 2025-12-14 10:35

学科分类: 生物医学工程 生物学 生物工程 计算机科学与技术

聚糖是生命的重要组成部分,广泛存在于各类生物的细胞表面糖萼中,其与聚糖结合蛋白(GBPs,如凝集素)的识别在细胞通讯、免疫反应、肿瘤发生等生理和病理过程中至关重要。然而,现有预测蛋白质-聚糖相互作用的机器学习模型,多局限于生物学相关的聚糖结构,难以外推至非传统或稀有聚糖的相互作用。

本研究开发了一种名为MCNet的机器学习模型,突破了上述限制。与传统模型基于单糖组成描述聚糖不同,MCNet采用原子水平的聚糖描述(如原子类型、手性状态、杂化方式等),能更全面地捕捉分子结构特征。为整合不同来源的实验数据(如聚糖微阵列的相对荧光单位RFU和亲和力测定的结合常数Ka),研究团队引入“结合分数”(fraction bound,f)参数,将不同实验条件下的结合数据统一转换为特定浓度下聚糖与GBP的结合比例,使模型训练更高效。

MCNet的训练数据来自 Consortium for Functional Glycomics(CFG)的聚糖微阵列数据及人工整理的274个糖模拟物(GM)的结合数据。通过10折交叉验证,该模型在预测蛋白质-聚糖相互作用强度上表现良好,其性能与现有基于单糖嵌入的模型相当甚至更优。尤为重要的是,MCNet能外推预测非训练集中的稀有聚糖对映体(如L型葡萄糖、L型甘露糖等)与GBPs的相互作用,即“交叉手性识别”。

实验验证方面,MCNet预测L-葡萄糖可与某些典型的岩藻糖结合GBPs(如UEA-I和AAL)发生结合。研究人员通过液体聚糖阵列(LiGA)和凝集素阵列实验,证实了这一意外发现,而传统模型未预测到此类相互作用。此外,模型还预测L-甘露糖不与ConA等典型D-甘露糖结合蛋白结合,这也与实验结果一致。

该研究表明,基于原子水平描述的机器学习模型能突破传统糖生物学研究中“生物学相关复杂性”的局限,探索“可行复杂性”的聚糖(如对映体)和糖模拟物的相互作用。这不仅为糖生物学研究提供了新工具,还有助于理解潜在镜像生命形式(由镜像分子构成的生命)与现有生命的分子识别机制,对合成生物学、免疫学等领域具有重要意义。

DOI: 10.1126/sciadv.adx6373

标签: MCNet 交叉手性识别 机器学习模型 糖生物学 蛋白质-聚糖相互作用