C5T5模型:用变换器可控生成有机分子

推荐理由: 基于Transformers的可控生成有机分子的预训练模型

作者: Daniel Rothchild、 Alex Tamkin、 Julie Yu、 Ujval Misra、 Joseph Gonzalez

简介:设计具有所需特性的有机材料的方法在医学、可再生能源、石化工程和农业等领域具有很大的潜在影响。然而,使用生成模型来设计具有所需特性的物质是很困难的,因为候选化合物必须满足多个约束条件,包括合成可访问性和其他对领域专家来说很直观但难以量化的指标。我们提出 C5T5,一种新颖的自监督预训练使转换器能够进行零镜头选择和替换编辑的方法,将有机物质改变为所需的属性值。C5T5 对 IUPAC 名称(一种标准化的分子表示)进行操作,可为有机化学家直观地编码丰富的结构信息,但在很大程度上被 ML 社区所忽视。我们的技术不需要经过编辑的分子对来训练,只需要粗略估计分子特性,并且它有可能比基于图形的方法更容易地对长程依赖性和对称分子结构进行建模。C5T5 还为领域专家提供了一个强大的界面:它通过选择和替换 IUPAC 名称片段授予用户对生成过程的细粒度控制,这使专家能够利用他们对结构-活性关系的直觉。

论文地址:https://arxiv.org/abs/2108.10307

内容中包含的图片若涉及版权问题,请及时与我们联系删除