本文介绍以色列理工学院Kira Radinsky课题组发表在CIKM会议上的一篇文章“Multi-Property Molecular Optimization using an Integrated Poly-Cycle Architecture”。分子先导优化是药物发现的一项重要任务,重点是生成类似于候选药物但具有增强属性的分子。大多数先前的工作都集中在优化单个属性上。然而,在实际环境中,作者希望产生满足多个约束条件的分子,例如,效力和安全性。同时优化这些属性是困难的,主要是由于缺乏满足所有约束的训练样本。作者在文章中提出了一种基于集成多循环架构(IPCA)的多属性分子优化新方法,该架构分别学习每个属性优化的转换,同时限制所有转换之间的潜在嵌入空间,能生成同时优化多个属性的分子。同时,作者提出了一种新的损失函数,它平衡了单独的转换并稳定了优化过程。我们评估了优化两个属性——多巴胺受体(DRD2)和药物相似性(QED)的方法,结果表明基于IPCA的多属性分子优化方法优于之前的先进方法,尤其是当满足所有约束且训练样本稀疏的情况。

论文链接:

https://dl.acm.org/doi/pdf/10.1145/3459637.3481938

贡献:

(1)作者设计了一种新颖的未配对端到端生成模型和独特的多循环训练方案,将分子指纹提供给翻译器来保持分子相似性,同时优化多个分子特性。这项工作是第一个在模型家族中使用SMILES分子表示解决多属性优化问题。

(2)作者提出了一种自适应损失函数,可以在训练期间平衡多属性优化,从而产生出色的结果。

(3)作者展示了大量数据集的实验结果,并优化了多层次的DRD2(多巴胺受体)和QED(药物相似性)属性。IPCA架构在生成具有更优属性分子的成功率方面表现出优于SOTA基线的性能,特别是当数据中只有少量满足多个属性的示例时。作者进行了消融测试,研究 IPCA在不同设置中的模型性能。

该系统目前正在部署用于个性化医学和专注于基于RNA治疗的纳米技术研究实验室,目标是使用IPCA架构来优化候选分子,以生成新的RNA载体分子。

内容中包含的图片若涉及版权问题,请及时与我们联系删除