- 简介本研究介绍了一种创新方法——Multi-Peptide,它将基于Transformer的语言模型与图神经网络(GNN)相结合,用于预测肽性质。我们将PeptideBERT(一种针对肽性质预测量身定制的Transformer模型)与GNN编码器相结合,以捕获基于序列和结构的特征。通过使用对比式语言-图像预训练(CLIP),Multi-Peptide将两种模态的嵌入对齐到共享的潜在空间中,从而提高了模型的预测准确性。在溶血和非污染数据集上的评估表明,Multi-Peptide具有鲁棒性,在溶血预测中实现了最新的86.185%的准确率。本研究突出了多模态学习在生物信息学中的潜力,为肽基研究和应用中的准确可靠预测铺平了道路。
-
- 图表
- 解决问题本文旨在通过结合transformer-based语言模型和图神经网络,提出Multi-Peptide方法,以预测肽的属性。同时,使用对比学习将多模态数据嵌入到共享的潜在空间中,以提高模型的预测准确性。本文旨在解决肽类研究和应用中的精确可靠预测问题。
- 关键思路本文的关键思路是将PeptideBERT和GNN编码器相结合,以捕捉序列和结构特征,然后使用对比学习将多模态数据嵌入到共享的潜在空间中,以提高模型的预测准确性。
- 其它亮点本文使用了hemolysis和nonfouling数据集进行评估,证明了Multi-Peptide的鲁棒性,并在hemolysis预测中实现了86.185%的准确率。本文的亮点在于使用多模态学习方法,为生物信息学领域提供了新的可能性。本文开源了代码,可供其他研究者使用。
- 最近的相关研究包括使用transformer-based模型进行肽序列预测的研究,以及使用图神经网络进行蛋白质结构预测的研究。例如,"ProteinBERT: A universal deep-learning model of protein sequence and function"和"Protein structure prediction using graph convolutional networks with a decoder-encoder residual attention network"。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流