Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models

2024年04月24日
  • 简介
    本文提出了一种基于扩散模型的框架,通过比较输入分子和重构图之间的相似性来检测OOD分子,从而避免了传统检测方法在OOD检测和ID分类性能之间的权衡。由于生成模型对重构ID训练样本的偏见,OOD分子的相似度得分将更低,从而有助于检测。然而,将这个基础框架扩展到实际检测应用仍然面临两个重要挑战:第一,基于欧几里得距离的流行相似度度量无法考虑复杂的图结构;第二,涉及迭代去噪步骤的生成模型在运行巨大药物池时耗时。为了解决这些挑战,本文提出了一种名为PGR-MOOD的分子OOD检测原型图重构方法,包括三个创新点:i)一种有效的度量方法,全面量化输入和重构分子之间的匹配程度;ii)一种创新的图形生成器,构建符合ID但远离OOD的原型图;iii)一种高效可扩展的OOD检测器,用于比较测试样本和预先构建的原型图之间的相似度,并省略每个新分子的生成过程。本文在十个基准数据集和六个基线上进行了大量实验,证明了其卓越性能。
  • 图表
  • 解决问题
    本文旨在解决开放世界测试数据集中存在的混杂着外部分布样本的问题,提出了一种基于扩散模型的框架来检测OOD分子。
  • 关键思路
    本文的关键思路是采用原型图重建来检测分子中的OOD,通过构建与ID相符但远离OOD的原型图,将测试样本与预构建的原型图进行比较以检测OOD。
  • 其它亮点
    本文的亮点包括:1)提出了一种有效的度量方式来全面量化输入和重建分子之间的匹配程度;2)创造性地构建了原型图生成器,以构建与ID相符但远离OOD的原型图;3)提出了一种高效且可扩展的OOD检测器,以比较测试样本与预构建的原型图之间的相似性并省略每个新分子的生成过程。实验使用了10个基准数据集和6个基线模型来证明其优越性。
  • 相关研究
    最近的相关研究包括:1)基于深度学习的图形分类和检测方法;2)基于图形嵌入的图形相似性计算方法;3)基于生成模型的OOD检测方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论