Explainable Molecular Property Prediction: Aligning Chemical Concepts with Predictions via Language Models

向作者提问

NEW

简介

提供可解释的分子属性预测对许多科学领域至关重要，例如药物发现和材料科学。尽管基于Transformer的语言模型在准确的分子属性预测方面表现出巨大的潜力，但它们既不提供化学上有意义的解释，也不能忠实地揭示分子结构和属性之间的关系。在这项工作中，我们基于语言模型开发了一个新的可解释分子属性预测框架，名为Lamole，它可以提供与化学概念对齐的解释。我们首先利用指定的分子表示——Group SELFIES——因为它可以提供具有化学意义的语义。由于Transformer中的注意机制本质上可以捕捉输入内部的关系，因此我们进一步将注意力权重和梯度结合在一起，以生成捕捉功能团相互作用的解释。然后，我们精心设计了一个边际损失，以明确优化解释，使其能够与化学家的注释对齐。我们将流形假设与详细的边际损失联系起来，以证明该损失可以将解释与数据流形的切空间对齐，从而产生与概念对齐的解释。对六个致突变性数据集和一个肝毒性数据集的实验结果表明，Lamole可以实现可比较的分类准确性，并将解释准确性提高高达14.8％，成为可解释分子属性预测的最新技术。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

解释性分子属性预测在药物发现和材料科学等领域中非常重要。然而，目前基于Transformer的语言模型虽然能够准确预测分子属性，但无法提供化学上有意义的解释，也不能真实地揭示分子结构-属性关系。本文提出了一种新的基于语言模型的可解释分子属性预测框架Lamole，旨在提供与化学概念对齐的解释。论文试图解决的问题是如何提供化学概念对齐的解释。
关键思路

Lamole框架的关键思路是将Group SELFIES作为分子的表示方法，利用注意力机制和梯度生成解释，通过边缘损失函数进行优化，从而使解释与化学家的注释对齐，实现概念对齐的解释。
其它亮点

论文使用六个突变原性数据集和一个肝毒性数据集进行实验，结果表明Lamole可以实现可比较的分类精度，并将解释精度提高了高达14.8％，是可解释分子属性预测领域的最新研究成果。
相关研究

在这个领域中，最近的相关研究包括：1）使用图卷积神经网络进行分子属性预测；2）利用机器学习和深度学习进行分子属性预测。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问