本文介绍Žiga Avsec教授团队与Calico的团队共同发表在NATURE MATHOD的工作:作者开发了一种基于Transformers的神经网络架构Enformer,这个深度学习架构能够整合来自基因组中远程交互(高达100 kb远)的信息,大大提高了从 DNA 序列预测基因表达的准确性。由于Enformer在预测变异对基因表达的影响方面较之前的模型来说更为准确,所以可以用于解释来自全基因组关联研究的疾病相关变异。此外,Enformer还学会了从DNA序列直接预测增强子-启动子的相互作用,比起先前直接输入实验数据预测结果的方法有了长足的进步。该模型能促进对基因调控结构的理解,并促进诊断遗传起源疾病的工具的开发。
参考文献:Avsec Ž, Agarwal V, Visentin D, et al. Effective gene expression prediction from sequence by integrating long-range interactions. Nat Methods.2021;18(10):1196-1203.
doi:10.1038/s41592-021-01252-x
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢