随着机器学习(ML)辅助蛋白质工程的进步,基于数据、生物物理学和自然进化的模型正被用来提出知情的蛋白质变异库进行探索。为实验屏幕合成这些库是一个主要瓶颈,因为获得大量精确基因序列的成本往往令人望而却步。退化密码子(DC)库是生成组合诱变库的具有成本效益的替代方案,其中突变针对少数氨基酸位点。然而,优化DC库以包括所需蛋白质变体的现有计算方法并不适合为ML辅助蛋白质工程设计库。

为了解决这些缺点,我们提出了信息库的退化密码子优化(DeCOIL),这是一种广义方法,直接优化DC库,以对蛋白质工程有用:采样序列搜索空间中可能具有高适应性和高多样性的蛋白质变体。使用计算模拟和湿实验室实验,我们证明了DeCOIL在两个特定案例研究中是有效的,并有可能应用于许多其他用例。与现有方法相比,DeCOIL具有几个优势,因为它是直接、易于使用、可推广和可扩展的。
有了随附的软件(https://github.com/jsunn-y/DeCOIL),DeCOIL可以很容易地实现,以生成所需的知情库。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢