- 简介在贝叶斯优化中,高效地优化离散数据且只有少量目标观测数据是一个挑战。我们提出了一种目标函数的连续松弛方法,并且证明了推理和优化可以计算上可行。我们特别考虑了只有极少观测数据和严格预算的优化领域;这是由于优化蛋白质序列以获得昂贵的生物化学特性而得到的启发。我们方法的优点有两个:问题在连续设置中得到处理,可用的序列先验知识可以直接纳入。更具体地,我们利用问题域上可用和学习到的分布来加权Hellinger距离,从而得到一个协方差函数。我们证明了所得到的采集函数可以用连续或离散优化算法进行优化,并在两个生物化学序列优化任务上进行了实证评估。
- 图表
- 解决问题本论文的问题是如何在贝叶斯优化中高效地优化离散数据,并且只有少量目标观测值。作者试图解决的问题是在极少的观测值和严格的预算下,优化蛋白质序列以获得昂贵的生物化学性质。
- 关键思路本论文的关键思路是通过目标函数的连续松弛来优化蛋白质序列。这种方法不仅可以在连续设置下处理问题,而且可以直接将可用的先验知识整合到序列中。
- 其它亮点值得关注的亮点是,本论文使用可用和学习到的分布来加权Hellinger距离,从而得到协方差函数,进而得到收购函数。作者还通过两个生物化学序列优化任务对该方法进行了实证评估。
- 最近在这个领域中,还有一些相关的研究,例如《Bayesian optimization in materials science: A comprehensive review》和《A Bayesian optimization framework for automatic chemical design》。
沙发等你来抢
去评论
评论
沙发等你来抢