

2024年6月14日-15日,第6届北京智源大会将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。
生成模型 论坛丨6月15日下午

李崇轩,中国人民大学高瓴人工智能学院副教授
李崇轩,中国人民大学高瓴人工智能学院副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作部署于文到图大模型DALL·E 2、Stable Diffusion和文到视频大模型ViDu等。曾获国际会议ICLR杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文等。入选博新计划、北京市科技新星,主持、参与多项国家自然科学基金、科技部课题。担任ICLR 、NeurIPS 等国际会议领域主席。
陈键飞,清华大学副教授
陈键飞于2014年和2019年分别在清华大学获得了计算机科学的学士和博士学位,并在TSAIL组与朱军教授合作。他的研究兴趣包括高效机器学习,特别是量化神经网络、随机优化算法和概率推理算法。在过去,他还开发了几个可扩展的主题模型训练系统。2019年,陈键飞 因杰出的工作获得了CCF优秀博士学位论文奖。他还曾在2009年获得中国信息学奥林匹克竞赛金牌。2018年,陈键飞 共同创立了RealAI,这是他职业生涯中的一个显著成就。
报告简介:不同于图像生成,视频生成在内容一致性、长视频生成、计算资源消耗等方面均面临巨大的挑战。但是,视频生成仍然在2023年取得了飞速的发展,涌现出Stable Video Diffusion、Runway Gen-2、Video Diffusion Transformer、Sora等优秀模型。本报告首先介绍当前视频生成面临的挑战,然后详细介绍最新的视频生成优秀模型,最后还对视频生成的技术发展进行展望。

卢志武,中国人民大学教授
卢志武博士,中国人民大学高瓴人工智能学院教授,博士生导师。2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011年毕业于香港城市大学计算机系,获PhD学位。研究方向为机器学习与计算机视觉。设计首个中文通用多模态预训练模型文澜BriVL。发表多模态领域首篇Nature子刊论文。早于OpenAI发布类Sora的视频生成底座VDT。
江毅,字节跳动 GenAI 研究员
江毅,字节跳动 GenAI 研究员,毕业于浙江大学,他的代表性工作有Sparse R-CNN,ByteTrack,UNINEXT等。当前的研究兴趣主要是计算机视觉和视觉生成基础模型的研发,在CVPR,ICCV,NeurIPS,ICLR,ICML,ECCV等会议和期刊上发表论文30余篇,其中多篇文章被录用为Oral,Spotlight,他的工作在github开源并累计获得20K star。
古纾旸,微软亚洲研究院视觉计算组研究员
古纾旸,在中国科学技术大学自动化系于2017年和2022年分别获得学士和博士学位,现为微软亚洲研究院视觉计算组研究员,主要研究方向为计算机视觉中的生成模型。研究兴趣主要包括生成对抗网络和扩散模型的理论及应用,探索新一代生成模型,以及生成模型质量评估。目前已在CVPR、ICCV、ECCV等会议上发表多篇论文并担任多个会议与期刊的审稿人。
个人主页:https://cientgu.github.io/
大会合作、咨询、赞助欢迎联系:press@baai.ac.cn
大会官网 https://2024.baai.ac.cn
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢