分子属性预测是指为分子打上一些生化特性标签,对于药物发现和设计过程至关重要。最近,随着机器学习的进步,基于深度学习的分子属性预测已经成为传统方法资源密集型的解决方案,并引起了广泛关注。其中,分子表示学习是影响分子属性预测性能的关键因素。已经提出了许多基于序列、基于图形和基于几何的方法。然而,现有研究大多仅关注于一种模态来学习分子表示,未能全面捕捉分子特征和信息。本文提出了一种新颖的多模态表示学习模型,称为SGGRL,它整合了序列、图形和几何特征,用于分子属性预测。具体来说,我们设计了一个融合层来融合不同模态的表示。此外,为了确保模态之间的一致性,SGGRL被训练以最大化相同分子的表示的相似性,同时最小化不同分子的相似性。为了验证SGGRL的有效性,使用了七个分子数据集和几个基线进行评估和比较。实验结果表明,在大多数情况下,SGGRL始终优于基线。这进一步强调了SGGRL全面捕捉分子信息的能力。总的来说,所提出的SGGRL模型通过利用多模态表示学习来提取多样化和全面的分子洞察力,展示了其改变分子属性预测的潜力。我们的代码已在https://github.com/Vencent-Won/SGGRL发布。
提问交流