可迁移的生成模型,让分子运动模拟跨越飞秒到纳秒时间尺度
作者: aeks | 发布时间: 2026-04-20 16:01 | 更新时间: 2026-04-20 16:01
理解分子结构、运动与反应性,关键在于连接跨越极大时间尺度的过程。常规分子动力学(MD)模拟虽能提供原子级细节,但受限于数值稳定性,必须采用飞秒级时间步长——这使其难以高效模拟化学与生物中真正重要的慢过程,例如蛋白质折叠、构象转变或药物解离,这些过程往往耗时微秒至数秒。这类问题被称为“采样难题”:因罕见跃迁事件频次极低,常规模拟需耗费海量算力才能统计可靠结果。
本文提出一种全新框架——可迁移隐式转移算子(TITO)。它不依赖传统逐帧积分,而是通过深度生成模型,直接从已有MD数据中学习分子在任意时间间隔(如1纳秒、10纳秒甚至更长)内的状态转移概率分布。TITO在小分子和四肽上训练后,不仅能精准复现训练体系的热力学平衡态(如玻尔兹曼分布),还能定量预测未见过的新分子(包括五肽至八肽)的构象空间、自由能景观及弛豫动力学过程。实验证明:TITO发现了一些传统长时间MD模拟未曾采样的真实亚稳态结构,且这些结构随后被高精度的副本交换(RE)MD模拟所证实;其预测的构象转换时间尺度可达微秒量级,与超长MD结果一致。
TITO的核心优势在于“可迁移性”与“可控精度”:它不局限于特定分子,能泛化到不同化学组成和更大尺寸的肽链(经简单物理标度修正后);用户还可根据需求灵活权衡计算成本与精度——例如,若只需快速生成热力学系综,可大幅降低算力消耗;若需精确捕捉动力学速率,则增加少量计算即可。在单块GPU上,TITO每日可模拟约10毫秒的物理时间,比传统MD快四个数量级(即1万倍)。该方法绕过了传统数值积分的瓶颈,代表了一种范式转变:不再“一步步算”,而是“直接学规律”。尽管目前尚限于隐式溶剂和数百原子规模,但它为研究生物学与材料科学中长期无法触及的超慢过程(如酶催化、相变、老化)开辟了切实可行的新路径。