Context-Guided Diffusion for Out-of-Distribution Molecular and Protein Design

2024年07月16日
  • 简介
    生成模型有潜力加速发现新型分子治疗和材料的关键步骤。扩散模型最近成为一种强大的方法,能够在无条件样本生成方面表现出色,并且在数据驱动的指导下,在其训练域内进行条件生成。然而,可靠地从训练数据之外的高价值区域进行采样仍然是一个未解决的挑战,当前的方法主要集中在修改扩散过程本身。在本文中,我们开发了上下文引导扩散(CGD),一种简单的即插即用方法,利用未标记的数据和平滑约束来改善指导扩散模型的超出分布的泛化能力。我们证明了这种方法在各种设置下都能带来实质性的性能提升,包括连续、离散和图结构扩散过程,并在药物发现、材料科学和蛋白质设计等领域应用。
  • 图表
  • 解决问题
    本文旨在解决扩展扩散模型在生成高价值区域样本方面的挑战,提高其在药物发现、材料科学和蛋白质设计等领域的应用效果。
  • 关键思路
    文章提出了一种简单易行的方法,称为上下文引导扩散(CGD),利用无标签数据和平滑约束来改善引导扩散模型的超出分布的泛化能力。
  • 其它亮点
    实验结果表明,CGD方法在连续、离散和图结构扩散过程中均能显著提高性能,并在药物发现、材料科学和蛋白质设计等领域具有广泛的应用。本文还开源了相关代码。
  • 相关研究
    相关研究包括:《Diffusion Models Beat GANs on Image Synthesis》、《Improved Techniques for Training Score-Based Generative Models》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论