机器学习方法已经广泛应用于药物发现领域,使得更强大和高效的模型成为可能。在深度模型出现之前,建模分子在很大程度上是由专家知识驱动的;为了表现分子结构的复杂性,这些手工设计的规则被证明是不够的。深度学习模型是强大的,因为它们可以学习问题的重要统计特征——但只有正确的归纳偏差。我们在两个分子问题的背景下解决这个重要的问题:表征和生成。深度学习的典型成功在于它能够将输入域映射到有意义的表示空间。这对于分子问题尤其尖锐,分子之间的“正确”关系微妙而复杂。本论文的第一部分将重点讨论分子表征,特别是性质和反应预测。在这里,我们探索了一种用于分子表示的Transformer式架构,提供了将这些模型应用于图形结构对象的新工具。抛开传统的图神经网络范式,我们展示了分子表示原型网络的有效性,它允许我们对分子的学习性质原型进行推理。最后,我们在改进反应预测的背景下研究分子表示。本论文的第二部分将集中在分子生成,这是至关重要的药物发现作为一种手段,提出有前途的药物候选人。我们开发了一种新的多性质分子生成方法,通过首先学习分子片段的分布词汇。然后,利用这个词汇,我们调查了化学空间的有效探索方法。
评论
沙发等你来抢