Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties

向作者提问

NEW

简介

本研究介绍了一种创新方法——Multi-Peptide，它将基于Transformer的语言模型与图神经网络（GNN）相结合，用于预测肽性质。我们将PeptideBERT（一种针对肽性质预测量身定制的Transformer模型）与GNN编码器相结合，以捕获基于序列和结构的特征。通过使用对比式语言-图像预训练（CLIP），Multi-Peptide将两种模态的嵌入对齐到共享的潜在空间中，从而提高了模型的预测准确性。在溶血和非污染数据集上的评估表明，Multi-Peptide具有鲁棒性，在溶血预测中实现了最新的86.185％的准确率。本研究突出了多模态学习在生物信息学中的潜力，为肽基研究和应用中的准确可靠预测铺平了道路。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在通过结合transformer-based语言模型和图神经网络，提出Multi-Peptide方法，以预测肽的属性。同时，使用对比学习将多模态数据嵌入到共享的潜在空间中，以提高模型的预测准确性。本文旨在解决肽类研究和应用中的精确可靠预测问题。
关键思路

本文的关键思路是将PeptideBERT和GNN编码器相结合，以捕捉序列和结构特征，然后使用对比学习将多模态数据嵌入到共享的潜在空间中，以提高模型的预测准确性。
其它亮点

本文使用了hemolysis和nonfouling数据集进行评估，证明了Multi-Peptide的鲁棒性，并在hemolysis预测中实现了86.185%的准确率。本文的亮点在于使用多模态学习方法，为生物信息学领域提供了新的可能性。本文开源了代码，可供其他研究者使用。
相关研究

最近的相关研究包括使用transformer-based模型进行肽序列预测的研究，以及使用图神经网络进行蛋白质结构预测的研究。例如，"ProteinBERT: A universal deep-learning model of protein sequence and function"和"Protein structure prediction using graph convolutional networks with a decoder-encoder residual attention network"。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问