论文简介:利用基因干预的体外细胞实验,例如使用CRISPR技术,是早期药物发现和目标验证的重要步骤,有助于评估关于生物机制和疾病病理之间因果关系的初步假设。由于有数十亿个潜在的假设需要检验,试管基因实验的实验设计空间是极其广阔的,可用的实验能力——即使是世界上最大的研究机构——与这一生物学假设空间的大小相比也相形见绌。机器学习方法,如主动学习和强化学习,可以通过整合来自不同信息源的先验知识,以及基于现有数据推断尚未探索的实验设计领域,从而帮助优化探索广阔的生物空间。然而,这一具有挑战性的任务并没有标准化的基准和数据集,迄今为止在这一领域进行的研究也很少。在这里,我们介绍GeneDisco,一个用于评估药物发现中实验设计的主动学习算法的基准套件。GeneDisco包含多个公开可用的实验数据集,以及用于实验设计和探索的最先进的主动学习政策的开源实现。
论文链接:http://arxiv.org/abs/2110.11875
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢