Quality-Weighted Vendi Scores And Their Application To Diverse Experimental Design

2024年05月03日
  • 简介
    实验设计技术,如主动搜索和贝叶斯优化,在数据收集和发现方面被广泛应用于自然科学。然而,现有技术往往偏向于开发搜索空间而不是探索,这使得它们陷入局部最优解。这种“崩溃”问题阻止了实验设计算法产生多样化的高质量数据。在本文中,我们扩展了Vendi得分,这是一系列可解释的基于相似度的多样性度量标准,以考虑质量因素。然后,我们利用这些质量加权的Vendi得分来解决各种应用中的实验设计问题,包括药物发现、材料发现和强化学习。我们发现,质量加权的Vendi得分可以让我们构建实验设计策略,灵活平衡质量和多样性,最终组装出丰富多样的高性能数据点。我们的算法导致有效发现数量比基线增加了70%-170%。
  • 作者讲解
  • 图表
  • 解决问题
    如何解决实验设计算法中的“坍塌”问题,即算法倾向于利用搜索空间中已知最优解而忽略探索其他可能性的问题?
  • 关键思路
    将Vendi分数进行扩展,使其能够同时考虑数据点的质量和多样性,并利用这些质量加权的Vendi分数来解决实验设计问题。通过平衡质量和多样性,构建实验策略,从而获得高质量的多样化数据点。
  • 其它亮点
    论文在药物发现、材料发现和强化学习等领域进行了实验,发现质量加权的Vendi分数可以比基准算法增加70% - 170%的有效发现数量。此外,论文提供了开源代码和数据集。
  • 相关研究
    与本文相关的研究包括:1.使用贝叶斯优化的实验设计算法;2.使用主动搜索的实验设计算法;3.使用多样性指标的实验设计算法。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问