AlphaFold问世五年了——这些图表告诉你它如何改变科学

作者: aeks | 发布时间: 2025-11-28 03:01 | 更新时间: 2025-11-28 03:01

学科分类: 生物信息学 生物化学与分子生物学 生物医学工程 计算机科学与技术

AlphaFold问世五年了——这些图表告诉你它如何改变科学
AlphaFold问世五年了——这些图表告诉你它如何改变科学

维也纳分子病理学研究所的生物化学家安德里亚·保利近十年来一直在研究精子与卵子如何结合。2018年,她的实验室在斑马鱼卵子表面发现了一种名为Bouncer的蛋白质,这种蛋白质对受精至关重要,但保利团队和其他研究者一直难以弄清Bouncer是如何识别精子细胞的。随后,一场变革发生了。

五年前,即2020年11月底,伦敦谷歌DeepMind的研究人员公布了AlphaFold2。这款用于预测蛋白质结构的人工智能工具能生成极其精确的3D模型,在某些情况下,其模型与实验图谱难以区分,在长期的结构预测挑战赛中表现卓越。AlphaFold的第一个版本于2018年公布,但其预测效果远不如后续版本,因此影响力有限。2021年,AlphaFold2的代码和数据库(已扩展到数亿个预测结构)发布,这意味着科学家现在几乎可以对任何蛋白质获得可靠的预测结果。英国欣克斯顿欧洲生物信息学研究所(EMBL-EBI,欧洲分子生物学实验室的一部分)的生物信息学家珍妮特·桑顿说:“能拥有任何蛋白质的模型产生了巨大影响,这就像结构生物学的第二次革命。”

对保利的团队而言,这款软件为他们指明了一条原本可能永远找不到的道路。该模型预测,一种名为Tmem81的蛋白质能稳定另外两种精子蛋白质形成的复合物,从而为Bouncer的结合创造一个口袋。实验证实了该工具的预测。保利表示,AlphaFold“加速了发现进程,我们在每个项目中都使用它”。她的团队关于这一研究的论文于2024年发表,是近4万篇引用2021年《自然》杂志上描述AlphaFold2论文的期刊文章之一。与同期许多其他被高度引用的生命科学和生物医学论文(包括关于新冠疫情的开创性报告)不同,人们对AlphaFold的兴趣似乎并未减弱。

DeepMind的约翰·詹纳(因开发AlphaFold与首席执行官德米斯·哈萨比斯共同获得2024年诺贝尔化学奖一半奖项)表示,他“深感自豪”的是,像保利这样的科学家能如此有效地使用这款工具。他想知道:“什么时候会有人因为使用了AlphaFold而获得这些重要奖项之一呢?”

研究人员表示,AlphaFold2能迅速产生影响,部分原因在于它的可及性。谷歌DeepMind向科学家免费提供了基础代码和其他参数,科学家很快就能大规模自行运行该软件,保利的团队就是这样做的。

由EMBL-EBI托管的AlphaFold数据库(AFDB)包含超过2.4亿个结构预测,涵盖了大多数已知蛋白质,全球190多个国家的约330万用户访问过该数据库。其中超过100万用户来自中低收入国家,包括中国和印度。

AlphaFold影响最大的领域似乎是结构生物学。本周发布的一项由谷歌DeepMind资助的关于AlphaFold影响的研究发现,使用AlphaFold的研究人员向名为“蛋白质数据库”(PDB)的实验模型库提交的蛋白质结构数量,比不使用AlphaFold的结构生物学研究人员“基准组”多约50%。与使用人工智能、结构生物学和蛋白质结构预测等其他“前沿”方法的研究人员相比,使用AlphaFold2的研究人员提交PDB的比例也更高。

詹纳说,他特别欣慰的是,用PDB数据训练的AlphaFold2在推导蛋白质结构方面非常有用。这些预测的结构可以帮助研究人员理解X射线晶体学和冷冻电镜产生的原始数据。“我很高兴它能帮助那些为我们提供数据的人。”詹纳补充道。

DOI: 10.1038/d41586-025-03886-9

标签: AlphaFold 精子卵子结合 结构生物学 蛋白质结构预测