关键词:静5前沿讲座

编者按


2025年6月10日,SES AI 公司人工智能副总裁刘凯博士访问北京大学前沿计算研究中心,并在静园五院做了题为“AI4Science: Industrial Applications & Foundation Models”的报告,报告由中心助理教授董豪老师主持。


本次报告中,刘博士首先介绍了人工智能与药物发现的交叉学科概况,之后讨论了基因表达、病理切片等多模态研究在癌症预测的作用,人工智能与科研自动化,全要素生物信息基础模型,大语言模型在科学问答领域的应用等。最后,刘博士展望了人工智能在科学研究领域的发展趋势。


人工智能与药物发现

刘博士首先介绍了人工智能在药物发现中的应用。药物研发首先需要确定靶点,然后设计相应的药物,最后通过临床实验进行验证。在此过程中,人工智能可以通过分析病人数据,找到潜在的药物靶点。此外,AI 还可以预测基因表达、蛋白表达和 DNA 表达,从而帮助理解细胞间的关系,并指导药物的选择和分配。


基础模型与癌症预测

刘博士提出,通过基础模型比较两组病人之间的基因表达量差异,可以了解某种基因的表达情况,从而判断病人是处于癌细胞增殖状态还是免疫细胞抑制癌细胞的状态。同时,这种方法也可以用来预测病人的生存率,帮助医生选择更有效的治疗方案。将病人的图像和基因表达信息进行结合分析,可以发现更多关于病情和治疗反应的细节。此外,刘博士还提出了一种新的数据采集方式和研究方式,即对病理切片进行孔洞检测,通过保留空间信息,使用基础模型来分析相互作用,决定病人是否能存活以及应给予何种药物。


人工智能在科研中的自动化应用

刘博士认为,AI Agent 还可以帮助科学家实现科研自动化,并提出利用AI进行文献查阅、科学家讨论、分析和验证结果的循环过程,展示了如何利用大语言模型进行科学会议,通过提示计算不同蛋白质,以及查找相关文献和知识。


全要素生物信息基础模型

刘博士还简要介绍了他们正在进行的一个创业项目。该项目基于人体系统的多层次结构(从单分子到组织、系统,再到人体),旨在整合不同层面的信息,包括 DNA、RNA 和蛋白质数据等。通过这种方式,希望建立一个全面的生物信息模型,以促进医学研究和诊断的发展。此外,强调了当前科研领域的一个共同趋势:整合不同来源的数据和技术,以期为疾病治疗提供新的见解和策略。


大语言模型与科学问答

刘博士随后介绍了与 NVIDIA 公司在科学问答方面的合作项目。他们通过一年时间,使用了128张 H100,并在物理化学材料、生物和计算机领域收集了能公开的数据,最终发布的模型是70b 的模型,虽然比不上更大的模型效果好,但在科学领域已达到最佳效果。


人工智能在科学研究领域的发展趋势

最后,刘博士强调了科学自动化发展,如生物医药、材料科学等领域的进展及与实验科学家的合作重要性,以及大语言模型对科学研究的推动作用。


报告期间与结束后,刘博士和中心教师与学生们开展了热烈的交流。本次报告以深入浅出、通俗易懂的语言阐明了 AI+科学探索领域的若干重要问题与前沿解决方案,并且指出了这一领域未来的发展方向。


图 | 龙宇星

文 | 范弘炜



往期讲座

静5杰出讲座回顾 | 周红院长谈协同发展准确、高效与创造性智能

静5杰出讲座回顾 | 马毅教授谈智能本质与人工智能的未来发展

静5杰出讲座回顾 | Bart Selman教授谈人工智能如何加速科学与数学发现

静5前沿讲座回顾 | 姚鹏晖教授谈Pauli analysis在量子算法中的应用

—   版权声明  —

本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。

内容中包含的图片若涉及版权问题,请及时与我们联系删除