UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment

2024年03月25日
  • 简介
    本文介绍了一种名为UAlign的无模板图形到序列管道,用于反合成预测。该方法结合了图神经网络和Transformer,可以更有效地利用分子的内在图形结构。基于化学反应过程中大多数分子结构保持不变的事实,作者提出了一种简单而有效的SMILES对齐技术,以促进未改变结构的复用,用于生成反应物。大量实验表明,该方法显著优于最先进的无模板和半模板方法。重要的是,作者的无模板方法实现了与强大的基于模板方法相当甚至更好的效果。科学贡献:作者提出了一种新颖的无模板图形到序列反合成预测管道,克服了Transformer-based方法在分子表示学习和化学信息利用方面的局限性。作者提出了一种无监督学习机制,用于建立产物原子与反应物SMILES符号的对应关系,实现了比监督SMILES对齐方法更好的结果。大量实验表明,UAlign显著优于最先进的无模板方法,并且与基于模板的方法相媲美或超越,其最强基线的准确性提高了5%(前5)和5.4%(前10)。
  • 图表
  • 解决问题
    解决问题:本论文旨在解决有机化学领域中单步反合成预测的问题,提出一种基于图神经网络和Transformer的无模板反合成预测方法。
  • 关键思路
    关键思路:本论文提出了一种无模板图到序列的反合成预测方法,结合了图神经网络和Transformer,能够更有效地利用分子的固有结构。同时,提出了一种简单而有效的SMILES对齐技术,以便于重复使用未改变的结构进行反应物生成。
  • 其它亮点
    其他亮点:本论文提出的方法在大量实验中表现优异,明显优于当前最先进的无模板和半模板方法,并且在效果上与强大的模板方法相媲美甚至超越。此外,作者提出了一种无监督学习机制,用于建立产物原子与反应物SMILES token之间的对应关系,达到了比监督SMILES对齐方法更好的效果。
  • 相关研究
    相关研究:最近的相关研究包括使用深度学习的反合成预测方法,如RETRO, RetroPath, Seq2Seq等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论