- 简介将分子的化学结构从图形表示或图像中识别出来,是一项具有挑战性的模式识别任务,这将极大地有益于药物开发。然而,现有的化学结构识别方法通常不具有很好的泛化能力,并且在数据稀疏或昂贵的领域(如手绘分子图像)面临的问题会减弱其有效性。为了解决这个限制,我们提出了一种新的化学结构识别工具,它具有最先进的性能,并且可以适应仅有有限数量数据样本和监督的新领域。与以前的方法不同的是,我们的方法提供原子级定位,因此可以将图像分割成不同的原子和化学键。我们的模型是第一个仅具有SMILES监督的原子级实体检测的OCSR模型。通过严格和广泛的基准测试,我们展示了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。
- 图表
- 解决问题本文旨在解决化学结构识别中的图像识别问题,特别是针对手绘分子图像等数据稀缺的领域。同时,该方法能够进行原子级别的定位和分割。
- 关键思路本文提出了一种新的化学结构识别工具,具有良好的泛化性能和适应性,能够进行原子级别的分割和定位,并且只需要SMILES监督。
- 其它亮点本文的方法在数据效率、准确性和原子级别实体预测方面均表现出色,使用的数据集有开源代码可供使用。实验结果表明,该方法的性能优于当前领域中的其他方法。
- 在该领域中,最近的相关研究包括《Deep Learning for Chemical Reaction Prediction》、《Neural Message Passing for Quantum Chemistry》等。
沙发等你来抢
去评论
评论
沙发等你来抢