近日,计算机系孙茂松团队成功研制了能够综合阅读生物医学领域文献和分子结构的深度学习技术,相关研究成果“连通分子结构与生医文献的深度学习系统”(A Deep-learning System Bridging Molecule Structure and Biomedical Text with Comprehension Comparable to Human Professionals)于2月14日在《自然·通讯》(NatureCommunications)上在线发表。

该论文通讯作者为清华计算机系刘知远副教授与孙茂松教授,第一作者为计算机系博士生曾哲妮与姚远。

论文链接:

https://www.nature.com/articles/s41467-022-28494-3

现有面向生医文献和分子结构信息的机器阅读技术只能孤立地处理特定类型信息,无法同时处理文本和分子结构等多种类型信息,难以提取和整合蕴藏其间的复杂知识,这与人类专家相比存在较大差距。为了解决这一挑战问题,孙茂松团队提出采用统一的深度学习框架连通分子结构和生医文献,建立富知识的机器阅读模型,实现对分子实体的全面深度理解,更好地协助生物医学研究。多项实验结果表明,该技术具有对分子结构和生物医学文献等信息的综合处理能力,特别是在分子性质理解测试任务上,该模型可以达到与人类专家相当的性能。

内容中包含的图片若涉及版权问题,请及时与我们联系删除