BindGPT: A Scalable Framework for 3D Molecular Design via Language Modeling and Reinforcement Learning

2024年06月06日
  • 简介
    生成给定蛋白质的新型活性分子对于生成模型来说是一项极具挑战性的任务,需要理解分子与其环境之间的复杂物理相互作用。在本文中,我们提出了一种新颖的生成模型BindGPT,它使用了一个概念上简单但功能强大的方法,在蛋白质的结合位点内创建3D分子。我们的模型同时产生分子图和构象,消除了额外的图形重建步骤的需要。我们使用大规模数据集对BindGPT进行预训练,并使用外部模拟软件的得分进行强化学习微调。我们演示了单个预训练语言模型如何同时作为3D分子生成模型、受分子图限制的构象生成器和结合口袋限制的3D分子生成器。值得注意的是,该模型不会对生成领域做出任何表示等价性假设。我们展示了这种简单的概念方法与预训练和扩展相结合,可以与当前最好的专门扩散模型、语言模型和图神经网络表现相当或更好,同时采样成本降低了两个数量级。
  • 图表
  • 解决问题
    论文旨在解决生成给定蛋白质的新型活性分子的难题,同时避免现有模型中的等变性假设。
  • 关键思路
    BindGPT是一种新型生成模型,通过在蛋白质结合位点内创建3D分子来生成分子图和构象,同时使用强化学习对其进行微调。
  • 其它亮点
    BindGPT不需要额外的图形重构步骤,可以同时作为3D分子生成模型,分子构象生成器和口袋条件下的3D分子生成器。论文使用大规模数据集进行预训练,并使用外部模拟软件的分数进行微调。实验结果表明,BindGPT可以与当前最佳的扩散模型、语言模型和图神经网络相媲美,但采样成本要低两个数量级。
  • 相关研究
    近期的相关研究包括:Diffusion Models for Generating Protein-Ligand Binding Modes、Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation、A Graph-to-Graphs Framework for Molecule Production等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论