(1)亲合性实验数据的大幅增加:从原始文献中收集的各类复合物的亲合性实验数据一直是PDBbind数据库的核心价值。PDBbind 2024版本收录了Protein Data
Bank中33660个生物分子复合物的亲合性实验数据,其中涵盖了27300余个蛋白-配体复合物、200余个核酸-配体复合物、4500余个蛋白-蛋白复合物及超过1400个蛋白-核酸复合物。与之前公开发布的2021版相比,2024版本的数据总量增长了23%;与之前免费发布的2020版相比,数据增长则更是高达43%。数据规模的显著扩展,对于训练表征分子相互作用的各种AI模型具有重大价值。
(2)复合物结构文件质量的继续提升:在PDBbind 2024版本的制作过程中,我们采用了全新的工作流程来处理Protein Data
Bank中蛋白-配体复合物的原始结构文件,使蛋白分子和配体分子在多种格式的结构文件中的表征变得更加准确和合理,与领域中其他软件更加适配。另外,我们在此次更新中也将这一工作流程应用于处理核酸-配体复合物结构,进一步拓展了数据库的应用范围。
(3)生物大分子复合物得到了重视:PDBbind数据库以往发布的版本只提供处理过的蛋白-小分子配体复合物结构文件。然而时至今日,PDBbind数据库中已经积累了相当数量的蛋白-蛋白复合物和蛋白-核酸复合物。此次2024版更新在PDBbind数据库历史上首次提供了处理后的生物大分子复合物结构文件,从而弥补了这一缺憾。我们建立了一套新的工作流程,用于合理处理原始PDB结构文件并适当修复分子结构中存在的问题。另外,我们在复合物亲合性数据记录中添加了必要的注释,使用户能够清晰解读这些复合物中相互作用链的信息。这些举措为专注生物大分子相互作用的研究人员提供了有力支持。
(4)功能增强的网络平台:全新的PDBbind+平台依托头部IT企业提供的商业云服务器资源,提供给用户更稳定的网络连接和更高效的在线计算服务。该平台不仅整合了用于分子结构可视化和数据搜索的常规功能,还集成了我们团队自主研发的生物活性分子反向找靶AI工具COMET以及超快速基于结构的虚拟筛选AI工具PLANET,用户可以在线提交作业并快速获得反馈结果。PDBbind+平台未来还将整合更多实用功能,致力于打造一个面向药物设计的综合性技术平台。
【注】PDBbind数据库的版权由复旦大学所有。PDBbind+网络平台由上海陶术生物科技有限公司协助建立和运营。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢