Explainable Molecular Property Prediction: Aligning Chemical Concepts with Predictions via Language Models

2024年05月25日
  • 简介
    提供可解释的分子属性预测对许多科学领域至关重要,例如药物发现和材料科学。尽管基于Transformer的语言模型在准确的分子属性预测方面表现出巨大的潜力,但它们既不提供化学上有意义的解释,也不能忠实地揭示分子结构和属性之间的关系。在这项工作中,我们基于语言模型开发了一个新的可解释分子属性预测框架,名为Lamole,它可以提供与化学概念对齐的解释。我们首先利用指定的分子表示——Group SELFIES——因为它可以提供具有化学意义的语义。由于Transformer中的注意机制本质上可以捕捉输入内部的关系,因此我们进一步将注意力权重和梯度结合在一起,以生成捕捉功能团相互作用的解释。然后,我们精心设计了一个边际损失,以明确优化解释,使其能够与化学家的注释对齐。我们将流形假设与详细的边际损失联系起来,以证明该损失可以将解释与数据流形的切空间对齐,从而产生与概念对齐的解释。对六个致突变性数据集和一个肝毒性数据集的实验结果表明,Lamole可以实现可比较的分类准确性,并将解释准确性提高高达14.8%,成为可解释分子属性预测的最新技术。
  • 作者讲解
  • 图表
  • 解决问题
    解释性分子属性预测在药物发现和材料科学等领域中非常重要。然而,目前基于Transformer的语言模型虽然能够准确预测分子属性,但无法提供化学上有意义的解释,也不能真实地揭示分子结构-属性关系。本文提出了一种新的基于语言模型的可解释分子属性预测框架Lamole,旨在提供与化学概念对齐的解释。论文试图解决的问题是如何提供化学概念对齐的解释。
  • 关键思路
    Lamole框架的关键思路是将Group SELFIES作为分子的表示方法,利用注意力机制和梯度生成解释,通过边缘损失函数进行优化,从而使解释与化学家的注释对齐,实现概念对齐的解释。
  • 其它亮点
    论文使用六个突变原性数据集和一个肝毒性数据集进行实验,结果表明Lamole可以实现可比较的分类精度,并将解释精度提高了高达14.8%,是可解释分子属性预测领域的最新研究成果。
  • 相关研究
    在这个领域中,最近的相关研究包括:1)使用图卷积神经网络进行分子属性预测;2)利用机器学习和深度学习进行分子属性预测。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问