图片

今天给大家分享的是韩国高丽大学计算机科学与工程系的Jaewoo Kang研究团队2022年11月23日发表在Bioinformatics上的论文“Perceiver CPI: A nested cross-attention network for compound-protein interaction prediction”。作者总结了现有预测方法的4条不足,如下:

  1. 由于分子描述符向量或分子指纹从一开始就包含有用的化学知识,因此,在小数据集上使用分子指纹和分子描述符可能会比使用复杂的图带来更好的性能。然而,由于表示的简化,将其应用于大数据集可能会欠拟合。
  2. 另一方面,GNN必须始终从头学习有意义的化学空间嵌入。此外,由于全局池步骤被简单地选择为所有原子特征的总和或平均值,过度平滑和信息丢失也是GNN的关键问题。
  3. 化合物网络和蛋白质网络表示的整合通常通过简单的拼接来进行,这实际上不适合揭示这些分子之间的关系。
  4. 从蛋白质序列中获取信息不仅是CPI任务中的研究重点,也是一般生物信息学中的研究焦点。目前的大多数方法都将蛋白质序列视为纯文本,无法充分揭示蛋白质的真实3D结构。

这项研究开发了Perceiver CPI深度学习模型,尝试解决上述三个挑战(1、2和3)。本研究的贡献总结如下:

  1. 为了避免过度平滑和信息丢失问题,提出了一种新的方法,通过结合来自扩展连接性指纹和图信息的信息来丰富化合物的表示。
  2. 据作者所知,Perceiver CPI是第一个使用嵌套交叉注意力来捕捉蛋白质和分子表示之间关系的方法。
  3. 实验结果表明,Perceiver CPI可以在新的对和新的化合物设

 

论文地址:https://doi.org/10.1093/bioinformatics/btac731
代码:https://github.com/dmis-lab/PerceiverCPI

内容中包含的图片若涉及版权问题,请及时与我们联系删除