
摘要
动机:基因调控网络反向工程(GRNs)一直是系统生物学中一个吸引人的研究课题。由于基因表达的复杂性和信息资源的匮乏,基因调控相互作用的计算预测一直是一个具有挑战性的问题。高通量空间基因表达数据,如显示时空表达模式的原位杂交图像,为grn的推断提供了丰富可靠的信息。然而,用于分析空间基因表达数据的计算工具还非常不发达。
结果:在本研究中,我们开发了一种从基因表达图像中识别基因调控相互作用的新方法,称为ConGRI。该方法的特点是采用对比学习方案和深度孪生CNN架构,自动学习表达式图像的高级特征嵌入,然后将嵌入的内容输入人工神经网络,以确定是否存在交互。我们将该方法应用于果蝇胚胎发生数据集,并识别了眼睛发育和中胚层发育的grn。实验结果表明,ConGRI在早期眼发育和中胚层发育的grn中,准确率分别达到76.7%和68.7%,大大优于以往的传统方法和深度学习方法。研究还揭示了果蝇眼睛发育的一些主要调节因素。

在GripDL (Yang et al., 2019)中,该策略只是将每对图像作为一个整体连接起来,并将其输入模型。在这里我们采取了一种更灵活的策略。我们不是结合原始图像,而是聚合CNN学习到的特征表示。具体来说,我们执行一个两阶段的学习过程,分别对应特征提取和决策。模型体系结构如上图所示。在第一阶段,我们构建了一个具有两个头部的孪生网络,其输入分别是TF和候选靶基因的表达图像。这两个头是两个相同的子网,即一个单一的CNN模型。通过对孪生网络进行对比学习,提取出区分正tf目标对和负tf目标对的模式。
利用训练好的CNN模型,我们可以得到所有输入图像的嵌入向量。在第二阶段,不同于GripDL, GripDL预测每个图像对的分数,并对所有属于同一TF-target对的图像对的分数进行平均,我们首先对每个基因对提取的图像特征进行平均,然后进行预测。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢