Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models

2024年06月27日
  • 简介
    我们描述了使用经过微调的预训练生成小语言模型(SLM)准确预测配体-蛋白相互作用(LPI)亲和力,也称为药物靶标相互作用(DTI)。我们在零样本设置下,在一系列与配体-蛋白相互作用相关的亲和力值上实现了准确的预测。模型输入仅使用配体的SMILES字符串和蛋白的氨基酸序列。我们的结果表明,在准确预测一系列配体-蛋白相互作用亲和力方面,我们相比于机器学习(ML)和自由能扰动(FEP+)方法有了明显的改进,这可以用于进一步加速针对具有挑战性的治疗靶点的药物发现活动。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在通过使用预训练的生成式小语言模型(SLMs)对配体-蛋白相互作用(LPI)亲和力进行准确预测,从而加速药物发现过程中对具有挑战性的治疗靶点的研究。
  • 关键思路
    使用SMILES字符串和蛋白质的氨基酸序列作为模型输入,通过微调预训练的SLMs,实现了在零样本情况下对一系列与配体-蛋白相互作用相关的亲和力值的准确预测,相比于机器学习(ML)和自由能扰动(FEP+)方法,本论文的方法实现了明显的改进。
  • 其它亮点
    本论文的实验结果表明,使用预训练的SLMs可以在零样本情况下准确预测一系列配体-蛋白相互作用的亲和力值。此外,本论文的方法还在准确性方面优于机器学习和自由能扰动方法。值得注意的是,本论文的方法只使用了SMILES字符串和蛋白质的氨基酸序列作为输入,这意味着可以在不需要其他信息的情况下进行快速预测。本论文的方法还可以为药物发现提供有力的支持。
  • 相关研究
    最近的相关研究包括使用不同的机器学习方法进行药物发现,以及使用自由能扰动方法进行配体-蛋白相互作用的预测。例如,一些相关论文的标题包括“使用深度学习预测药物-蛋白相互作用”和“基于自由能扰动的分子动力学模拟方法的改进”。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问