近日,湖南大学史俊峰和曾湘祥课题组联合在《Advanced Science》上发表了题为“HydrogelFinder: A Foundation Model for Efficient Self‐Assembling Peptide Discovery Guided by Non-Peptidal Small Molecules”的研究论文,提出了一种全新的自组装肽发现基础模型——HydrogelFinder。该模型通过利用大量非肽小分子,智能搜索广阔的化学空间,实现了从零到一的自组装肽的高效设计和合成。

简介
在自然界中,分子间通过非共价连接自发形成高度有序的结构是一种神奇的现象,这种现象被命名为self-assemble,即自组装。自组装在生物体内普遍发生,从DNA到蛋白质到细胞膜,这些都是自组装过程所产生的杰作。自组装肽是一类特殊的分子,它们能够在水中形成有序的纳米结构,进而形成三维网络,最终形成超分子水凝胶。这些水凝胶在结构和功能上与生物体中的细胞外基质相似,因此它们在组织工程和药物递送等方面具有巨大的应用潜力。传统的自组装肽的研究依赖于偶然性发现或者在已有的组装基序上做修改,缺乏系统性的设计方法。现有的计算方法虽能进行一定的预测,但在精确设计多样性的自组装肽方面仍面临挑战。
HydrogelFinder模型将语言模型(LLMS)应用于自组装肽的设计中,在短短19天内从理论设计出发,实验验证了17种候选肽,其中9种具有自组装能力且长度在1-10个氨基酸之间,展现了模型的高效性和创新性。
方法
HydrogelFinder的总体架构如图1所示,包括三大部分:

图1. HydrogelFinder流程图
HydrogelFinder-mining:通过文献挖掘和已知数据构建训练数据集,用于模型的预训练和微调。
HydrogelFinder-GPT:使用基于Transformer框架的深度生成模型,对分子结构特征与自组装倾向进行建模。
HydrogelFinder-predict:进行虚拟筛选,评估候选肽的自组装能力。
结果分析

图2 HydrogelFinder-GPT 和自组装肽化学结构的性能评估。
作者通过多个指标在HydrogelFinder-GPT生成自组装分子能力方面进行评估,以证明该方法的有效性。
HydrogelFinder不仅能生成结构合理的分子,还能确保这些分子具有预期的生物活性(图2A),这一结果证实了模型在预测与实际生物应用之间的桥梁作用。作者通过消融实验,证明非肽类小分子辅助能够增加HydrogelFinder生成候选自组装肽的化学多样性(图2B)。同时通过UMAP降维分析和可视化显示了(图2C),HydrogelFinder生成的分子覆盖了广泛的化学空间,说明非肽小分子数据辅助模型能够探索新的化学领域,为自组装肽的开发提供更多可能性。图2D展示了HydrogelFinder-GPT能够生成长度不等(1-14个氨基酸)的自组装肽序列。此分布证实了HydrogelFinder模型在生成具有广泛长度和潜在功能的自组装肽方面的能力。
实验验证

图4 水凝胶的湿实验表征
作者在生成库中随机选取了17条多肽进行合成与表征。其中,有9条多肽具备自组装能力,其序列长度分布在1-10个氨基酸之间。通过旋转流变仪和透射电子显微镜证实了多肽组装形成纳米纤维和中等强度的水凝胶(图4A,B)。细胞实验证实自组装多肽具有优良的生物相容性(图4C,D)。这些实验结果不仅证明了HydrogelFinder在自组装肽设计中的实用性,也展示了其在生物医学领域应用的潜力。
总结:
HydrogelFinder模型的开发,为自组装肽的系统设计和快速发现提供了新的科学方法和技术平台。该自组装肽设计的基础模型(HydrogelFinder),将极大地推动生物材料和药物递送系统的研究与开发。
参考资料
Ren, X., Wei, J., Luo, X. et al. HydrogelFinder: A Foundation Model for Efficient Self‐Assembling Peptide Discovery Guided by Non-Peptidal Small Molecules. Adv Sci (2024).
https://doi.org/10.1002/advs.202400829
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢