- 简介过渡路径采样 (TPS),即寻找连接能量景观上两点的可能路径,由于现实中原子系统复杂性的原因,仍然是一个挑战。当前的机器学习方法采用昂贵的、特定任务的且无需数据的训练流程,这限制了它们从最近原子级机器学习的进步中获益的能力,例如高质量的数据集和大规模预训练模型。在这项工作中,我们通过将候选路径解释为从预训练生成模型所学习的得分函数诱导的随机动力学中采样的轨迹来解决 TPS 问题,这些生成模型具体包括去噪扩散和流匹配模型。在这些动力学框架下,寻找高概率的过渡路径等价于最小化昂萨格-马赫卢普 (Onsager-Machlup, OM) 动作泛函。这使我们能够以零样本的方式重新利用预训练生成模型进行 TPS,而无需像以往工作那样训练特定任务的 TPS 模型。我们在多种分子系统上展示了我们的方法,获得了多样且物理上逼真的过渡路径,并且能够超越预训练模型原始训练数据集的范围。我们的方法可以轻松集成到新的生成模型中,随着模型规模的扩大和数据可用性的增加,这种方法具有重要的实际意义。
- 图表
- 解决问题该论文试图解决过渡路径采样(TPS)问题,即在复杂的能量景观中找到连接两个点的高概率路径。这是分子动力学领域的一个长期挑战,特别是在处理现实世界中原子级别的复杂系统时。虽然已有的机器学习方法有所尝试,但这些方法通常需要昂贵的任务特定训练,并且无法充分利用现代原子级机器学习的优势,例如高质量数据集和大规模预训练模型。
- 关键思路论文提出了一种创新方法,将候选路径解释为由预训练生成模型(如去噪扩散和流匹配模型)所学习的分数函数诱导的随机动力学下的轨迹。通过最小化Onsager-Machlup(OM)作用泛函,可以高效找到高可能性的过渡路径。这种方法允许以零样本方式复用现有的预训练生成模型,避免了针对TPS任务重新设计和训练模型的需求,从而显著降低了计算成本并提高了灵活性。
- 其它亮点论文展示了其方法在多种分子系统上的应用效果,生成了多样化且物理上合理的过渡路径。此外,该方法能够超出预训练模型原始训练数据集的范围进行泛化,表明其具有良好的适应性。实验设计涵盖了不同类型的分子系统,并验证了方法的有效性和鲁棒性。作者还提到,随着更大规模、更高质量的生成模型的发展,这种方法有望进一步改进。代码尚未提及是否开源,但未来可能提供实现细节以促进后续研究。
- 近年来,与TPS相关的研究主要集中在开发专用的机器学习模型或优化算法来加速路径采样。例如,《Machine Learning Enhanced Transition Path Sampling》探讨了结合神经网络的TPS方法;《Denoising Diffusion Models for Molecular Dynamics》则专注于利用扩散模型生成分子轨迹。此外,《Score-Based Generative Modeling of Molecular Systems》提出了基于分数的生成模型用于分子模拟。然而,这些工作大多依赖于特定任务的数据训练,而本文首次尝试直接利用预训练模型解决TPS问题。


提问交流