Understanding active learning of molecular docking and its applications

2024年06月14日
  • 简介
    随着计算方法和资源的不断提升,通过分子对接进行超大规模虚拟筛选已经成为一种主要的策略,用于实现硅胶发现。由于超大规模虚拟筛选的穷举性质,主动学习方法已经成为一种减少计算成本的手段,通过迭代小规模对接和机器学习模型训练来实现。虽然现有文献已经经验证了主动学习方法的有效性,但是仍然需要对代理模型如何在不考虑三维结构特征(如受体构象和结合位点)的情况下预测对接得分进行重要的研究。因此,在本文中,我们通过对六个受体靶点进行基准研究,探究了主动学习方法如何有效地预测对接得分,仅使用2D结构,并在什么情况下可能特别有效。我们的研究发现,代理模型倾向于记忆在获取步骤中获得高对接得分化合物中普遍存在的结构模式。尽管存在这种倾向,代理模型在虚拟筛选中表现出实用性,例如在从DUD-E数据集中识别活性化合物和从EnamineReal库中获得高对接得分化合物时,这个库比最初的筛选池大得多。我们的综合分析强调了主动学习方法在虚拟筛选活动中的可靠性和潜在适用性。
  • 作者讲解
  • 图表
  • 解决问题
    本论文试图探究如何使用2D结构有效预测分子对受体的结合得分,以及主动学习方法在虚拟筛选中的应用。论文通过实验验证了该方法的可靠性和潜在适用性。
  • 关键思路
    论文的关键思路是使用主动学习方法,通过迭代小规模对接和机器学习模型训练来减少计算成本,并使用2D结构进行预测。研究表明,即使不考虑三维结构特征,模型也能够有效地预测分子对受体的结合得分。
  • 其它亮点
    论文通过实验验证了该方法的可靠性和潜在适用性,并在DUD-E数据集和EnamineReal库中成功鉴定了活性化合物和高得分化合物。值得关注的是,研究发现模型倾向于记忆在获取步骤中获得高得分化合物时普遍存在的结构模式。论文使用了六个受体目标的基准研究,还讨论了该方法的局限性和未来研究方向。
  • 相关研究
    在该领域的相关研究包括:1. "Active learning in computer vision" 2. "Active learning for natural language processing" 3. "Active learning in drug discovery"
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问