
01
遇见/背景
在蛋白质内引入非天然氨基酸(ncAA)具有重要意义,能够用来制备新功能的抗体药物、创造具有新型催化机制的酶、辅助研究复杂的蛋白质构效关系等。基因密码子扩展技术通过重新编程密码子表中的"无义密码子",将其分配给具有多样化功能的非天然氨基酸(ncAA),进而利用细胞内源性蛋白质翻译机制实现ncAA的在蛋白质内的引入。其中,源自巴氏甲烷八叠球菌和马氏甲烷八叠球菌的吡咯赖氨酸-tRNA合成酶(PylRS)/tRNA系统是最广泛应用的ncAA整合工具之一。然而,PylRS突变体针对多数ncAA的整合效率不高,导致含ncAA蛋白质的表达量降低。
02
遇见/内容
近日,浙江大学化学工程与生物工程学院于浩然团队在Nature Communications发表论文“Machine learning-guided evolution of pyrrolysyl-tRNA synthetase for improved incorporation efficiency of diverse noncanonical amino acids”。这是该团队利用人工智能与自动化Biofoundry实现古菌酪氨酰-tRNA合酶(MjTyrRS)酶活性迅速进化(Nature Commun 2025, 16, 1553:浙大于浩然合作Nat Commun|基于蛋白质语言模型与自动化设施构建蛋白质体外连续进化平台)后,在基因密码子扩展领域取得的又一重要进展。论文报道了通过运用人工智能算法对PylRS的tRNA结合域(TBD)进行系统性设计与改造,并结合催化域(CD)突变,显著提升了6类ncAA的整合效率,为基因密码子扩展技术更广泛应用奠定基础。
PylRS的tRNA结合区域作为改造“热点”
PylRS由tRNA结合域(TBD)与催化中心域(CD)构成。鉴于TBD结构复杂性,研究采用机器学习辅助TBD改造,将蛋白质氨基酸序列转化为数值序列后经傅里叶变换(FFT)提取特征,进而训练偏最小二乘回归(PLSR)模型,建立预测活性的FFT-PLSR模型。
FFT-PLSR模型的架构
利用FFT-PLSR模型,对12个文献报道的单点突变组成的4096(212)种组合空间进行预测,筛选Top8突变体进行实验验证。结果显示,所有突变体活性均显著超越出发酶,其中七点突变体Z7(Com1-IFRS)活性提升11倍。
机器学习用于PylRS tRNA结合区域改造发现突变体Com1-IFRS
研究进一步采用无监督深度学习模型,包括基于序列的蛋白质语言模型ESM、基于结构的MutCompute及逆折叠模型ProRefiner,预测TBD区域潜在增效位点。在测试的95个模型预测单点突变中,ESM、MutCompute与ProRefiner的阳性率分别为6.25%(1/16)、11.36%(5/44)与9.52%(4/42),最终在N7、H63、K67、T68、V73、D76六个关键位点鉴定出27个活性提升单点突变。
基于无监督学习模型改造tRNA结合区域
将27个活性提升单点突变进行理论组合,形成11,520种可能序列空间。利用FFT-PLSR模型预测11,520种组合活性,筛选Top20进行验证,发现所有突变体活性均超过Com1-IFRS,最优变体Z7-3(Com2-IFRS)活性较Com1-IFRS提升2.8倍,较出发酶提升30.8倍。
深度学习模型辅助设计更高活性突变体
PylRS 催化结构域已经被改造以接受多种ncAA。为了测试Com1和Com2是否能提高各种ncAA在蛋白质内的引入效率,研究人员选择了具有较大序列多样性和底物多样性的CD区域突变体,它们可以接受具有不同侧链结构的ncAA,比如苯丙氨酸衍生物、色氨酸衍生物、酪氨酸衍生物、半胱氨酸衍生物、组氨酸衍生物和赖氨酸衍生物等。本研究基于模板序列MmPylRS构建了NACA(N346A/C348A)、BtaRS(N346G/C348Q)、GML(N346G/C348M/W417L)、QF(N346Q/Y384F)、IFGFF(L305I/Y306F/L309G/C348F/Y384F)、AcKRS(L301M/Y306L/L309A/C348F)和WS(C348W/W417S/Y384F)等CD区域突变体,并利用同源重组的方法将这些CD突变体与Com1、Com2分别进行组合,共构建16个组合突变体。实验结果表示,Com2突变体对非天然氨基酸的引入效率均有大幅提高。
PylRS TBD突变Com2和Com1显著提升各类CD突变活性
研究最后利用分子动力学模拟对最佳突变体进行了分析。Com1/Com2通过增加活性中心近距离构象比例、重构氢键网络、增强与motif2的氢键相互作用,优化催化微环境。结合自由能计算表明,突变体显著提升C74/C75/A76三个末端碱基的结合能。动态互相关(DCCM)分析进一步证实,突变体增强了蛋白质系统的动力学协同性。
PylRS、Com1-PylRS、Com2-PylRS的动态相互作用网络
本研究不但提供了一系列具有高活性的PylRS突变体,也为PylRS的改造提供了可用的机器学习策略。浙江大学化学工程与生物工程学院张群峰博士、浙江大学杭州国际科创中心江玲研究员为论文共同第一作者,浙江大学化学工程与生物工程学院于浩然研究员为论文通讯作者。该研究得到了科技部重点研发计划合成生物学重点专项、浙江省“尖兵”“领雁”研发攻关项目、国家自然科学基金等的支持。研究同时得到了浙江大学杭州国际科创中心生物与分子智造研究院大仪平台和iBioFoundry自动化设施平台的大力支持。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢