点击蓝字 关注我们
微末生物
Nanomega BioAI
近年来,冷冻电子断层扫描技术(Cryo-EM)在确定RNA-蛋白质复合体(RNP)的结构方面取得了突破性进展。然而,由于分辨率限制,许多Cryo-EM密度图中存在无法进行手动坐标追踪和模型搭建的重要生物学区域。为了解决这一难题,斯坦福大学Rhiju Das实验室与加州大学洛杉矶分校(UCLA)周正洪教授团队等合作者开发了一种名为DRRAFTER的计算框架,能够在核糖核蛋白复合物的Cryo-EM密度图中从头构建RNA结构模型。
DRRAFTER的工作原理
DRRAFTER (de novo ribonucleoprotein modeling in real space through assembly of fragments together with experimental density in Rosetta) 是一种基于Rosetta的计算框架,用于从头构建核糖核蛋白复合物中RNA部分的结构模型。它结合了片段折叠、对接和实验密度信息,能够在低分辨率Cryo-EM局部密度图中构建高精度的RNA结构模型。
1、其工作流程可以分为以下几个步骤:
【已知蛋白质结构的拟合】
首先,将已知结构的蛋白质组件单独拟合到Cryo-EM 密度图中。这一步是手动进行的,但相对快速。
【理想RNA螺旋的拟合】
然后,将基于用户提供的RNA二级结构的全原子模型自动构建到Rosetta中,并通过片段折叠和对接将其拟合到密度图中。
【缺失RNA坐标的区域划分】
识别出RNA螺旋周围缺少RNA坐标的区域,并从更大的模型中提取出周围的蛋白质和RNA螺旋。
【缺失RNA坐标的填充】
将这些子结构输入到Rosetta中的 DRRAFTER 协议中,通过蒙特卡洛模拟进行RNA坐标的填充。在这个过程中,首先使用低分辨率RNA-蛋白质能量函数进行打分,该函数考虑了RNA-RNA和RNA-蛋白质相互作用,并补充了一个评分项来监测与密度图的匹配程度。最后,使用全原子能量函数进行打分,并补充了一个评分项来奖励与密度图的匹配程度,从而产生最终模型。
【模型优化】
使用PHENIX-ERRASER方案对得分最高的十个模型进行整合优化,以生成最终结构。
图1:DRRAFTER的工作流程。包括确定蛋白质原子模型、接入原始理想RNA模型、分割RNA所在区域、以及通过折叠和对接迭代RNA模型使其符合成像密度坐标
2、DRRAFTER 与现有方法相比具有以下优势:
【从头构建RNA结构】
大多数现有计算方法专注于蛋白质模型构建和优化,而对于 RNA-蛋白质组装体,通常难以在隔离状态下实验确定 RNA 子组件的坐标,因此 RNA 坐标经常被排除在 RNP 复合物模型之外。DRRAFTER 能够从头构建RNA结构,这在 RNA-蛋白质组装体中尤为重要。
【适用于低分辨率数据】
大多数高分辨率的蛋白复合物结构图仍然包含低分辨率区域,手动坐标追踪不可行。DRRAFTER 能够在低分辨率cryo-EM密度图中构建RNA结构,这对于许多难以手动追踪坐标的区域非常有用。
【准确性和可靠性】
DRRAFTER 模型的准确性与手动拟合蛋白-RNA复合物子组件晶体结构构建的模型相当,并且可以通过计算模型的收敛性来可靠地估计模型准确性(图2)。
【自动化和高效】
DRRAFTER 的自动化流程可以加速模型构建过程,并减少人为偏差。
图2:研究人员确定了两个可预测DRRAFTER最终模型构建的指标。首先,冷冻电镜成像的局部分辨率为最终建模的精度确定了近似的界限(a-d);其次,在模型搭建后,通过计算前十名得分模型之间的平均配对均方根偏差能够评估 DRRAFTER 模型的收敛性,收敛性能够较好地反映DRRAFTER模型的质量(e-g)
DRRAFTER的应用案例
研究人员使用 DRRAFTER 在多种 RNA-蛋白质组装体中构建了高精度模型,包括(图3):
【剪接体】
DRRAFTER成功地构建了酵母U1 snRNP和剪接体P复合物的模型,这些模型与高分辨率结构非常吻合。
【线粒体核糖体】
DRRAFTER构建的线粒体核糖体模型与其高分辨率结构成像结果具有可比的准确性。
【CRISPR-Cas9-sgRNA 复合物】
DRRAFTER构建的CRISPR-Cas9-sgRNA复合物模型与高分辨率结构非常吻合。
【端粒酶和 HIV-1 反转录酶启动复合物】
DRRAFTER构建的端粒酶和HIV-1反转录酶启动复合物模型与先前发表的手动构建模型一致,但所需的人工工作量显著减少。
【MS2病毒基因组】
DRRAFTER成功地构建了MS2基因组的全原子模型,这是迄今为止无法实现的。
图3:DRRAFTER 能够大大加速(局部)低分辨率密度图中的RNA建模;a,c,e: DRRAFTER 构建得分前十名的模型 (红色为RNA,灰色为蛋白质,透明浅灰色为密度图)在端粒酶、HIV-1反转录酶启动复合物和MS2基因组中的叠加;b,d: DRRAFTER构建出的模型与先前构建的手动模型的叠加,吻合良好;f: DRRAFTER在3.6 Å分辨率的MS2冷冻电镜密度图和先前发表的10.5 Å较低分辨率密度图中搭建出的两个RNA模型的叠加,二者吻合良好
DRRAFTER 的局限性
【依赖于 RNA 二级结构信息】
DRRAFTER在给定的准确性取决于原给定的RNA二级结构信息的准确性。
【需要结构优化工具的改进】
为了提高最终模型的精度,需要开发能够处理更大幅度结构变化并专注于低分辨率数据优化的结构优化工具。
【无法重新建模蛋白质骨架】
DRRAFTER 无法重新建模蛋白质骨架或构建缺失的蛋白质坐标,因此可能会将 RNA 坐标构建到附近的未填充蛋白质密度中。
DRRAFTER 的未来发展方向
为了进一步提高DRRAFTER的性能,未来的研究可以集中在以下几个方面:
【整合RNA二级结构预测技术】
将Cryo-EM数据和DRRAFTER框架与核磁共振或生化技术相结合,以获得更准确的RNA二级结构信息。
【开发更先进的结构优化工具】
开发能够处理更大幅度结构变化并专注于低分辨率数据优化的结构优化工具。
【整合蛋白质结构建模工具】
将 DRRAFTER 与现有的蛋白质结构建模工具相结合,以完成 RNP 建模的完整流程。
总结而言,DRRAFTER是一种强大的计算工具,能够在局部低分辨率Cryo-EM密度图中从头构建精确的RNA结构模型。它为 RNA-蛋白质复合体的结构研究提供了新的可能性,并将加速和简化复杂核糖核蛋白复合物中局部RNA结构模型的构建过程。
中科微末团队在生物大分子及其复合体的三维结构解析方面技术成熟、经验丰富,能够在原子级分辨率解析多种生物大分子材料的三维结构。我们致力于开展冷冻电子显微镜与结构生物学研究方面的AI及计算方法研究,并为药企和高校医院科研工作者提供一站式、自动化、原子级分辨率的结构解析服务,帮助科研人员实现“原子结构自由”。
评论
沙发等你来抢