TransMA: an explainable multi-modal deep learning model for predicting properties of ionizable lipid nanoparticles in mRNA delivery

2024年07月08日
  • 简介
    作为主要的mRNA输送载体,离子可溶脂质纳米粒子(LNPs)表现出极佳的安全性、高转染效率和强烈的免疫反应诱导作用。然而,LNPs的筛选过程耗时且成本高昂。为了加快高转染效率mRNA药物输送系统的鉴定,我们提出了一种可解释的LNPs转染效率预测模型,称为TransMA。TransMA采用了多模态分子结构融合架构,其中精细的原子空间关系提取器分子3D Transformer捕捉分子的三维空间特征,而粗粒度的原子序列提取器分子Mamba捕捉分子的一维分子特征。我们设计了mol-attention机制块,使其能够对齐粗粒度和精细粒度的原子特征,并捕捉原子空间和序列结构之间的关系。TransMA在当前最大的LNPs数据集上使用脚手架和悬崖数据分割方法,包括Hela和RAW细胞系,实现了预测转染效率的最先进性能。此外,我们发现TransMA捕捉了微小结构变化和显著转染效率变化之间的关系,为LNPs设计提供了有价值的见解。此外,TransMA对外部转染效率数据的预测与实际转染效率保持一致的顺序,证明了其强大的泛化能力。代码、模型和数据可在https://github.com/wklix/TransMA/tree/master上公开获取。我们希望未来高精度的转染预测模型能够帮助LNPs的设计和初步筛选,从而加速mRNA的设计过程。
  • 图表
  • 解决问题
    提高LNPs转染效率预测的速度和成本,加速mRNA设计过程。
  • 关键思路
    使用一种可解释的LNPs转染效率预测模型TransMA,结合分子3D Transformer和分子Mamba的多模态分子结构融合架构,通过mol-attention机制块捕捉原子空间和顺序结构之间的关系,实现高精度的转染效率预测。
  • 其它亮点
    TransMA在当前最大的LNPs数据集上使用scaffold和cliff数据拆分方法,取得了最先进的转染效率预测性能,并提供了有关微妙结构变化和显着转染效率变化之间关系的有价值见解。此外,TransMA对外部转染效率数据的预测与实际转染效率保持一致的顺序,证明其具有强大的泛化能力。代码、模型和数据公开在GitHub上。
  • 相关研究
    近期的相关研究包括:1. A Deep Learning-based Model for Predicting the Efficiency of Lipid Nanoparticle-mediated siRNA Delivery; 2. A Machine Learning Approach to Predicting the Efficiency of RNA Interference in Drosophila; 3. Deep Learning for Gene Expression Prediction: A Review.
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论