基于靶点的高通量筛选在传统的新药研发中占据着主导地位。几十年来,这种筛选也一直是计算机辅助开发药物的途径,甚至包括近些年深度学习的应用。然而,化学药物对单一蛋白的调控结果与药物在机体的治疗效果或副作用之间的相关性很差,从基于靶点筛选产生的先导化合物到批准药物的失败率也因此居高不下。

在传统筛选技术中,基于表型化合物的筛选也是筛选方式之一,但此种方式存在着筛选效率较低的问题。为提高基于表型化合物的筛选效率,美国俄亥俄州立大学Ping Zhang(张平)及其研究团队发明了一套用高通量机制驱动的表型化合物筛选深度学习框架DeepCE。

DeepCE利用图形神经网络和多头注意机制对化合物结构与基因、基因与基因之间的关联进行建模,从而可预测最原始的化学结构产生的差异,并以基因表达图谱的方式展示出来。此外,研究人员还提出了一种新颖的数据扩充方法,可从L1000数据集中的不可靠实验中提取有用的信息。通过将DeepCE生成的基因表达图谱与下游分类任务的观察数据进行比较,实验结果支持了DeepCE的有效性。为了证明DeepCE的价值,研究人员将其应用在药物重定位上,并产生了与临床证据一致的新型先导化合物。

该技术于2月1日发表在《自然机器智能》(Nature Machine Intelligence)上。

内容中包含的图片若涉及版权问题,请及时与我们联系删除