对于生物体来说,其最基本的生命活动和调节总与DNA和RNA有关。近年来,随着围绕着这二者的数据分析和研究技术的发展,有关DNA和RNA的组学研究也蓬勃发展,而深度学习亦在这两个方向取得了显著的进展。
对于DNA而言,不论调控基因组学与蛋白和其他调控分子多么相关,它始终作为调控基因组学的研究核心。故而,在本周日上午10:00,我们将由屠鑫明老师带领我们回顾深度学习在这个方向的应用,同时探讨DNA大模型在基因调控中的潜在应用以及目前工作的一些局限性。与此同时,由于RNA分子和其相互作用的复杂性,RNA科学的发展一直相对较慢,缺乏系统性的理解。幸运的是,Uni-RNA提出了规模最大的RNA序列预训练模型,从而针对性地解决了部分RNA研究中的问题。因此,在本次分享会中,将由王喜老师带领我们介绍Uni-RNA,并展望未来RNA科学的研究方向。
集智俱乐部联合西湖大学助理教授吴泰霖、斯坦福大学计算机科学系博士后研究员王瀚宸、博士研究生黄柯鑫、黄倩,华盛顿大学博士研究生屠鑫明,共同发起以“大模型与生物医学”为主题的读书会,共学共研相关文献,探讨基础模型在生物医学等科学领域的应用、影响和展望。读书会从2023年8月20日开始,每周日早上 9:00-11:00 线上举行,持续时间预计8周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。
主题一:
DNA 大模型在调控基因组学中的综述和展望
众所周知,基因的表达调控是一个复杂的生物学过程,该过程涉及到不同分子层面的相互作用,复杂得犹如一张大网。然而,基因表达调控的核心始终是DNA本身。从2015年开始,深度学习技术已经在调控基因组学领域得到广泛应用。本次分享会旨在总结过去在这个方向的应用经验,同时探讨DNA大模型在这个领域的潜在应用以及当前工作所面临的一些限制和挑战,从而通过这次分享会激发相关领域的讨论和研究,以推动基因表达调控领域研究的进一步发展。大纲:
1 基础背景知识介绍:Introduction to regulatory genomics
2 对基因调控组学的概述:Framework to Understand regulatory genomics
3 DNA语言大模型工作回顾:Overview of DNA language models
主题二:
Uni-RNA预训练大模型在RNA科学中的应用
RNA在生命活动中扮演着至关重要的角色,作为基因信息传递(转录过程)的核心分子,它的重要性不可忽视。然而,由于RNA分子及其相互作用关系的复杂性,RNA科学长期以来一直发展缓慢,学术界对RNA科学仍然缺乏系统的框架性理解。在此背景下,由王喜老师作为主要开发者之一的Uni-RNA成为了迄今为止规模最庞大的RNA序列预训练模型,它包括几乎所有已知种类的RNA,用于训练和学习。这一创新性的模型不仅为RNA科学提供了前所未有的工具,还在众多下游任务上展现了最领先的性能,如RNA结构预测、mRNA性质预测以及RNA生物学功能的预测。这一进展为研究人员提供了更强大的资源,从而有望深化我们对RNA的理解,推动学界在这一领域的探索和发现。RNA在生物医学中的应用
RNA科学的困难
数据量的难题
生物语言的探索
模型框架介绍
下游任务
“四梁N柱”:底层创新通路
mRNA疫苗设计平台
复杂生物体系建模方法
屠鑫明是华盛顿大学博士研究生,目前就读于华盛顿大学西雅图 Paul G Allen school,导师是Sara Mostafavi, 之前在北京大学取得生物和计算机的双学位,研究兴趣主要是利用机器学习解析基因组学数据,包括variant to function预测,单细胞多组学,perturbation modeling。 个人主页:https://xinmingtu.cn/
王喜是深势科技算法研究员。上海交通大学博士在读。他本科毕业于上海交通大学,曾荣获上海交通大学A等奖学金,国际基因工程大赛金奖与最佳软件队提名奖,上海市五四青年奖章等荣誉。主要研究兴趣包括预训练模型,生物大分子结构与功能预测,手性分子表征,在 Angew.Chem.Int.Ed,Science China Chemistry 等期刊发表多篇研究论文,是RNA预训练大模型Uni-RNA 主要开发者之一。所涉及到的参考文献:
UNI-RNA: UNIVERSAL PRE-TRAINED MODELS REVOLUTIONIZE RNA RESEARCH,Xi Wang, Ruichu Gu, Zhiyuan Chen, Yongge Li, Xiaohong Ji, Guolin Ke, Han Wen,bioRxiv 2023.07.11.548588; doi:https://doi.org/10.1101/2023.07.11.548588
2023年11月12日(本周日)上午 10:00-12:00扫码参与大模型与生物医学读书会,加入群聊,获取系列读书会回看权限,成为大模型与生物科学读书会的种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动AI+Science社区的发展。大模型与生物医学:
AI + Science第二季读书会启动
生物医学是一个复杂且富有挑战性的领域,涉及到大量的数据处理、模式识别、理论模型建构和实验验证等问题。AI基础模型的引入,使得我们能够从前所未有的角度去观察和理解这个领域的问题,加速科学研究的步伐,提高医疗服务的效率和效果。这种交叉领域的合作,标志着我们正在向科技与生物医学深度融合的新时代迈进,对于推动科学研究、优化医疗服务、促进人类健康有着深远的影响。集智俱乐部联合西湖大学助理教授吴泰霖、斯坦福大学计算机科学系博士后研究员王瀚宸、博士研究生黄柯鑫、黄倩,华盛顿大学博士研究生屠鑫明,共同发起以“大模型与生物医学”为主题的读书会,共学共研相关文献,探讨基础模型在生物医学等科学领域的应用、影响和展望。读书会从2023年8月20日开始,每周日早上 9:00-11:00 线上举行,持续时间预计8周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。
详情请见:
大模型与生物医学:AI + Science第二季读书会启动
AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。
评论
沙发等你来抢