【论文链接】https://www.nature.com/articles/s41551-021-00819-5
【代码链接】https://github.com/rxn4chemistry/rxnaamapper
对功能失调的线粒体的清除减少是衰老和与年龄有关的神经退行性病症,如阿尔茨海默病,的共同特征。治疗这种受损的线粒体吞噬的策略将受益于对线粒体吞噬调节剂的识别。本文报告了结合使用无监督机器学习,包括分子预训练模型、分子结构的矢量表示、药理指纹和构象体指纹等,和跨物种方法来筛选和实验验证新的有丝分裂诱导化合物。从一个自然发生的化合物库中,该工作流程使本文能够识别出18个小分子,其中有两个强效的有丝分裂诱导剂,Kaempferol和Rhapontigenin。在线虫和啮齿动物的AD模型中,本文发现这两种有丝分裂诱导剂都能增加谷氨酸和胆碱能神经元的存活率和功能,消除淀粉样蛋白-β和tau的病变,并改善动物的记忆。本文的研究结果表明,在不同的AD模型中存在着一种保守的记忆丧失机制,这种机制是由有丝分裂的缺陷所介导的。计算-实验筛选和验证工作流程可能有助于发现刺激神经元健康和大脑稳态的有效的有丝分裂调节剂。

上图a展示了模型预训练的工作流程。在数据准备阶段,将预训练数据集中的分子转为SMILES序列、分子相互作用特征和三维构象体指纹;然后设计三个编码器(用于一维、二维和三维表征)来嵌入输入数据,并将这些表征嵌入汇总到多表征的编码器模型中;然后将多表征嵌入传递给表征解码器,以预训练多表征的分子模型。
图b展示了虚拟筛选过程的工作流程。虚拟筛选库包含3,274个来自传统中药数据集的分子(Macau数据库),根据预训练的分子表征模型生成每个化合物的一维、二维和三维分子表征;然后对表征进行汇总和聚类,并对表征应用空间降维以过滤掉异常值;计算每个化合物的相似度得分以生成前N个候选化合物。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢