图片

论文链接:https://arxiv.org/abs/2209.13178

 今天给大家介绍腾讯AI Lab赵沛霖博士团队以及德克萨斯大学阿灵顿分校黄俊洲教授团队、深圳大学欧阳乐教授团队近期(20220922)上传到ArXiv上的论文“MARS: A Motif-based Autoregressive Model for Retrosynthesis Prediction”。这篇论文将逆合成预测问题建模为图生成问题,并提出新的端到端训练的自回归模型。标准数据上的实验证明,对比于SOTA方法,所提出的模型有了重大提升。

  上图展示了这篇论文提出的方法的反应物生成过程。Edit 和 AddingMotif 指图形转换操作,其中 Edit 阶段描述从产物到合成子的键和原子变化,并起到反应中心识别的作用,而 AddingMotif 阶段通过向合成子添加适当motif来进行合成子补全。输入分子图由图形神经网络(GNN)编码,而递归神经网络(RNN)则按顺序预测图形转换操作。在 Edit 阶段,RNN 预测一系列 Edit 操作,直到 FinishEdit 指示 Edit 阶段的结束以及 AddingMotif 阶段的开始。在 AddingMotif 阶段,RNN 依次添加motif,直到没有附着原子(用粉红色突出显示)留下。在上图示例中,第一个 Edit 操作应用于 S=O 键,新键类型为 None,表示删除键。对于 AddingMotif 操作,motif 中的接口原子(绿色)和 合成子/中间产物中的附着原子表示相同的原子,并在将 motif 附加到合成子/中间产物时合并为单个原子。