从少量数据中构建可迁移的手性选择性模型

作者: aeks | 发布时间: 2026-02-13 10:01 | 更新时间: 2026-02-13 10:01

学科分类: 化学 化学工程与技术 统计学 计算机科学与技术

确定一类催化剂以优化新反应的对映选择性是一项艰巨的挑战,这类新反应可能涉及已知底物类型的不同组合,或是全新的化合物类别。基于已报道反应集训练的统计模型有助于预测样本外的转化反应1–5,但这类模型常面临两个挑战:(1)数据稀疏,即关于催化剂-底物相互作用的信息有限;(2)简单的立体电子参数可能无法描述机理复杂的转化反应6,7。本文报道了一种描述符生成策略,该策略考虑了催化剂或底物变化时对映决定步骤的改变,使我们能够对涉及不同配体和底物类型的反应进行建模。作为验证案例研究,我们收集了对映选择性镍催化C(sp3)-偶联反应的数据8,并利用从被认为参与不对称诱导的过渡态和中间体中提取的特征来训练统计模型。这些模型能够优化底物范围中报道的效果不佳的案例,并且适用于未见过的配体和反应伙伴。这种方法为简化催化剂和反应开发提供了机会,能够将从稀疏数据中获得的知识定量转移到新的化学空间中。

DOI: 10.1038/s41586-026-10239-7

标签: 催化剂开发 对映选择性 描述符策略 统计模型 镍催化C(sp3)-偶联 (nickel-catalyzed-Csp3-coupling)