Preference optimization of protein language models as a multi-objective binder design paradigm

2024年03月07日
  • 简介
    我们提出了一种基于指令微调和自回归蛋白质语言模型(pLMs)的直接偏好优化(DPO)的多目标结合物设计范例。多个设计目标通过直接优化专家策划的优先顺序数据集来编码到语言模型中,该数据集包括首选和非首选分布。我们展示了所提出的对齐策略使得ProtGPT2能够有效地设计符合指定受体和药物可发展性标准的结合物。生成的结合物样本表现出中位点等电点(pI)提高了17\%至60\%。
  • 图表
  • 解决问题
    本文旨在通过指令微调和直接偏好优化(DPO)自回归蛋白质语言模型(pLMs),提出一种基于多目标的粘合剂设计范式,以解决粘合剂设计中的多个目标问题。
  • 关键思路
    通过直接优化专家策划的偏好序列数据集,将多个设计目标编码到语言模型中,从而实现对粘合剂的设计。
  • 其它亮点
    实验结果表明,所提出的方法可以有效地设计出符合特定受体和药物可发展性标准的粘合剂。而且,生成的粘合剂样本表现出中位点等电点(pI)提高了17%-60%。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如“Protein-Ligand Binding Affinity Prediction via Graph Neural Networks”,“Protein-Ligand Binding Site Prediction Based on Graph Neural Networks and Active Learning”,“A Deep Learning Approach for Protein-Ligand Binding Affinity Prediction Based on Capsule Neural Network and Attention Mechanism”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论