化合物效力预测是机器学习在药物发现中的一种流行应用,为此使用了越来越复杂的模型。总体目标是识别对给定目标高度有效的新化学实体。效力预测模型的相对性能及其准确性限制在该领域继续存在争议,深度学习是否可以进一步推进效力预测仍不清楚。

波恩大学(Rheinische Friedrich-Wilhelms-Universität Bonn)的研究人员分析和比较了不同计算复杂度的效力预测方法,并表明简单的最近邻分析(Simple nearest-neighbour analysis)被视为该领域最先进的机器学习方法的准确性标准。此外,使用不同模型的完全随机预测被证明可以在一个数量级内重现实验值,这是由常用化合物数据集中的效力值分布产生的。总而言之,这些发现对于评估机器学习性能的典型基准计算具有重要意义。模型评估中通常应包括最近邻分析等简单控制。此外,最好的和完全随机的效力预测之间的狭窄界限是不现实的,需要考虑替代基准标准。

该研究以「Simple nearest-neighbour analysis meets the accuracy of compound potency predictions using complex machine learning models」为题 于 2022 年 12 月 14 日发布在《Nature Machine Intelligence》。

图片

论文链接:https://www.nature.com/articles/s42256-022-00581-6

内容中包含的图片若涉及版权问题,请及时与我们联系删除