Accurate de novo sequencing of the modified proteome with OmniNovo

向作者提问

NEW

简介

翻译如下：翻译后修饰（PTMs）作为一种动态的化学语言，调控着蛋白质的功能，然而当前的蛋白质组学方法仍无法检测到大量经修饰的蛋白质。标准的数据库搜索算法因搜索空间呈组合式爆炸而受限，难以鉴定尚未明确或结构复杂的修饰。本文中，我们提出了OmniNovo——一种统一的深度学习框架，可直接从串联质谱图中对未修饰和已修饰肽段进行无需参考序列的从头测序。与现有仅限于特定类型修饰的工具不同，OmniNovo通过学习通用的碎片化规律，在单一连贯模型内解析多种多样的翻译后修饰。通过结合质量约束的解码算法与严格的假发现率估计，OmniNovo实现了当前最优的准确性，在1%假发现率下比传统方法多鉴定出51%的肽段。尤为重要的是，该模型能够泛化至训练过程中未曾见过的生物学修饰位点，揭示了蛋白质组中的“暗物质”，从而实现对细胞调控机制无偏且全面的分析。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

现有的蛋白质组学方法在识别翻译后修饰（PTMs）时面临数据库搜索空间的组合爆炸问题，导致大量未表征或复杂修饰的肽段无法被检测。这限制了对‘修饰蛋白组暗物质’的全面解析，是一个长期存在且亟待解决的问题。
关键思路

OmniNovo提出了一种统一的深度学习框架，能够无需参考数据库地直接从串联质谱数据中解析未修饰和修饰肽段的序列。其核心创新在于学习通用的肽段碎裂规律，并结合质量约束解码算法与严格的假发现率控制，在单一模型中支持多样化的PTMs识别，突破了传统工具仅限特定修饰类型的限制。
其它亮点

OmniNovo在标准1%假发现率下比传统方法多识别51%的肽段，展现出显著性能优势；模型具备良好的泛化能力，可识别训练中未见的生物学修饰位点；采用了真实质谱数据进行训练与验证，实验设计严谨；论文强调了对‘蛋白组暗物质’的探索潜力，为细胞调控的无偏分析提供了新工具；代码与模型已开源，促进社区进一步研究。
相关研究

1. Deep learning for de novo peptide sequencing from mass spectrometry data 2. Prosit: proteome-wide prediction of peptide tandem mass spectra by deep learning 3. PILOT_AI: scalable and accurate tandem mass spectral identification using deep learning 4. DeepMass: Mass Spectrometry Imaging by Deep Learning 5. MS-Net: a deep neural network for peptide identification from tandem mass spectra

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问