转自微信公众号:吕华课题组
大家好,今天给大家分享一篇近期发表在J. Am. Chem. Soc.上的研究进展,题为:Graph-Based Machine Learning Identifies Oxygenated Block Polymer Replacements for Conventional Plastics and Elastics。该工作的通讯作者是来自牛津大学的Georgina L. Gregory、David A. Clifton、Clive R. Siviour、Charlotte K. Williams和伦敦国王学院的David Kohan Marzagão
目前塑料和弹性体的生产、使用及废弃处理方式普遍不可持续,造成严重的塑料污染和二氧化碳排放问题,因此亟需开发可持续聚合物材料。含氧聚合物(如聚酯和聚碳酸酯)由于可来源于生物质或二氧化碳,并可通过开环聚合(ROP)实现可控合成且具备良好的回收潜力,被认为是重要的替代材料。然而现有商业化材料多为均聚物,性能仍难以覆盖高性能工程塑料和弹性体需求。相比之下,含氧嵌段聚合物通过相分离可显著调控力学性能并保持热塑性回收优势。近年来机器学习在聚合物设计中展现出潜力,但多数模型基于烃类聚合物数据,对含氧聚合物尤其是机械性能预测研究仍然有限,因此亟需结合机器学习探索含氧嵌段聚合物的结构-性能关系,以加速可持续材料的发现。
本文提出了一种基于图的链接预测的聚合物推荐系统 PolyReco,用于发现满足特定机械性能阈值的含氧 ABA 嵌段聚合物。研究利用由 ROP 和 ROCOP 合成的聚酯和聚碳酸酯数据构建的数据库训练模型,将材料设计问题转化为阈值条件下的链接预测问题,通过学习不同嵌段化学结构及其聚合度之间的关系,预测新的嵌段组合是否能够满足目标应力和应变性能要求,并推荐潜在可合成的材料候选。

图1. PolyReco概念示意图。
作者构建了一个包含 143 种ABA 型含氧嵌段聚合物的机械性能和包含 331 种尚未用于嵌段聚合物构建的含氧均聚物的实验数据的数据库,使模型能够推荐更为多样化的结构的数据库。每个嵌段聚合物包括 A 嵌段和 B 嵌段两个节点,一条边和边的方向进一步编码ABA 结构模式,整体组成一个图结构。PolyReco模型采用链接预测(link prediction)算法来预测新的 ABA 嵌段组合以及相应的 DP 范围,同时评估对应的拉伸强度和断裂应变。通过可视化工具,进一步筛选模型输出的 ABA 聚合物结构,再通过实验合成和表征进一步验证。(图1)

图2. PolyReco预测的三个主要阶段。
PolyReco 的链接预测过程包含 三个主要阶段:初始化、信息集成、特征更新与链接预测。首先,在初始化阶段,模型根据每个嵌段的 SMILES 结构提取分子特征,并结合聚合度(DP) 对特征进行非线性加权,然后将这些特征映射到模型可以处理的潜在空间中。其次,在信息集成阶段,模型通过图神经网络的消息传递机制,让每个嵌段从相邻嵌段及自身节点获取信息,并利用图注意力机制对这些信息进行加权整合,从而学习不同嵌段组合之间可能产生的结构相互作用。最后,在特征更新与链接预测阶段,模型根据整合后的信息更新每个嵌段的表示,并将两个嵌段的特征进行组合,预测它们是否能够形成满足目标机械性能要求的嵌段聚合物结构。(图2)

图3. PolyReco模型效果评估。
接着,作者使用多种指标评估 PolyReco 的性能。AUROC(Area Under the Receiver Operating Characteristic Curve)代表真阳性率和假阳性率的权衡,数值越接近1说明模型的分类能力越强。AUPRC(Area Under the Precision–Recall Curve)能够更好地反映模型在正确识别目标样本时的可靠性,AUPRC 越高,说明模型在保证较高召回率的同时仍能保持较好的预测准确性。宏平均精确率(Macro Precision)是一种用于多类别或不平衡分类问题的评价指标,数值越高代表预测准确性越好。整体证明了该模型在预测潜在嵌段聚合物结构方面具有较好的可靠性和实用价值。(图3)

图4. PolyReco预测聚合物结构的示例工作流程。
为了评估 PolyReco 在实际应用中的可行性,作者选取了三个不同材料性能的案例研究。对于每一组预设的 应力σ 和应变 ε 阈值,PolyReco 会生成对应的 ABA 嵌段聚合物结构及其各嵌段的DP。随后,这些输出结果通过可视化工具进行进一步筛选,对结构、合成可行性、玻璃化转变温度等关键参数进行过滤,帮助确定材料的加工温度窗口和使用温度范围,随后再进行实验验证。(图4)

图5. 新材料的实验力学性能及与预测阈值的比较。
三个具体的案例研究首先是以高抗冲聚苯乙烯(HIPS) 为目标性能区域,模型从约 1.4 万个候选结构中筛选出 PCL-b-poly(CHO-alt-PA)-b-PCL 三嵌段聚酯,实验结果显示其强度和伸长率均达到目标范围,具有替代 HIPS 的潜力。其次,在模拟聚二甲基硅氧烷(PDMS )的低模量高弹性区域时,模型预测并合成了 PCPC-b-PDL-b-PCPC 三嵌段聚合物,成功再现 PDMS 类似的柔性性能。最后,在苯乙烯嵌段弹性体(SBC)性能区域中,模型预测了一种含三元碳酸酯嵌段的结构,实验验证了其性能可与传统苯乙烯弹性体相当。这些结果表明 PolyReco 能够从已有数据中预测新的嵌段组合并获得满足目标机械性能的材料,但其可持续性和经济性仍需进一步验证。(图5)
综上,本研究利用基于图结构的机器学习开发了 PolyReco 模型,成功预测满足特定机械性能阈值的ABA 嵌段聚合物结构,显示了机器学习在加速可持续聚合物材料发现方面的潜力。未来工作可通过扩展数据库并引入更多材料性能指标(如杨氏模量、韧性、蠕变和粘弹性)进一步提升模型能力,从而更有效地指导新型可持续嵌段聚合物的设计与开发。
作者:ZXY 审校:ZHR
DOI: 10.1021/jacs.5c21416
Link: https://doi.org/10.1021/jacs.5c21416
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢