标签-新-2025.jpg

7
机器智能前沿论坛
第 7 期

机器智能前沿论坛·第7期将采取线下的方式、在2025年国际图象图形学学术会议(ICIG 2025)期间进行。本期聚焦"多模态智能感知与表征学习",邀请了4位嘉宾进行分享。2025年11月2日(周日)13:00,MIR与您相约徐州!


往期论坛精彩回顾:

【回放】机器智能前沿论坛·第1期 | 类脑机器学习

【回放】机器智能前沿论坛·第2期 | 伪装场景感知及多模态应用 

【回放】机器智能前沿论坛·第3期 | 大规模预训练: 数据、模型和微调

【回顾-线下】机器智能前沿论坛·第4期 | 多模态数据感知与学习

【回放】机器智能前沿论坛·第5期 | AI for Art

【回放】机器智能前沿论坛 · 第6期 | 多模态表征学习



论坛简介




时间:2025年11月2日(周日) 13:00-15:00

地点:徐州宝信君澜度假酒店 二层彭氏厅

日程安排:

微信图片_2025-10-20_161048_424.png

论坛简介:

一、基本情况

本次论坛由CSIG视觉检测专委会联合中国科学院自动化研究所主办英文学术期刊Machine Intelligence Research(MIR)共同举办。讲者阵容包括赫然研究员、马佳义教授、江俊君教授、罗娜副研究员等多位在多模态感知、三维视觉、生成模型、脑机接口等前沿方向有深厚积累的专家学者。论坛旨在推动多模态环境下鲁棒表征学习与智能感知技术的深度融合,涵盖从理论算法、数据集构建到实际应用的广泛议题。


二、举办背景与必要性

随着深度学习技术的持续演进,人工智能正从单模态理解向多模态融合加速发展。多模态人工智能不仅能够协同视觉、语言、语音、触觉等多种信息源,提升系统在复杂环境中的感知与推理能力,更被认为是实现下一代人工智能的关键路径。人类天生具备多模态学习能力,即便在信息缺失的情况下仍能形成整体认知,因此如何让机器具备类似的能力已成为学术界与工业界共同关注的焦点。


另一方面,三维视觉感知技术的进步与多模态融合的紧密结合,正在机器人导航、人机交互、增强现实、数字孪生、智能制造等众多领域中发挥核心作用。多模态三维感知系统通过整合视觉、深度、红外、事件等多种数据源,显著提升了智能体对复杂环境的理解与交互能力。


Machine Intelligence Research(MIR)作为中国科学院自动化研究所主办、谭铁牛院士主编的国际高水平期刊,长期以来持续推动机器智能领域的前沿交流与成果传播。本次论坛依托MIR已积累的学术影响力与品牌效应,整合"多模态表征学习"与"三维视觉感知"两大前沿方向,既是对当前研究热点的积极响应,也为跨领域合作提供了宝贵平台。


三、拟达到的目的与意义

本论坛旨在构建一个贯通学术研究与产业实践的高水平交流平台,推动多模态智能感知与表征学习技术的创新与发展。通过邀请深耕领域前沿的专家学者、分享最新研究成果与应用案例,论坛将深入探讨多模态数据融合、三维视觉建模、生成式模型安全、脑机接口等多维议题,促进理论方法突破与技术落地结合。


论坛不仅致力于推动学术共同体内的深入讨论,更希望加强学术界与产业界的联动,推动多模态技术在具身智能、数字医疗、工业检测等实际场景中的广泛应用,为我国乃至全球人工智能前沿发展注入新动能。



论坛主席




张辉 教授

湖南大学

张辉,1983年生,博士、二级教授、博士生导师,现任湖南大学人工智能与机器人学院院长、湖南大学未来技术学院院长、视觉感知与控制技术国家工程研究中心副主任,入选国家高层次人才计划,兼任科技部“十四五”智能机器人专项专家组成员、中国自动化学会常务理事、中国图象图形学学会副秘书长。长期从事机器人视觉检测、图像识别与智能制造等研究。主持国家重点研发计划、科技创新2030重大项目等20余项,发表论文66篇,授权发明专利52项。以第一完成人获湖南省科技进步一等奖(2022–2023)、二等奖(2019)、中国商业联合会科技进步一等奖(2019),作为主要完成人获国家技术发明二等奖(2018)、国家级教学成果奖二等(2022)等省部级以上奖励20余项。


范登平 教授 (MIR编委)

南开大学

范登平,南开大学教授、博导,计算机科学与技术系主任,入选国家级“四青”人才,曾在瑞士苏黎世联邦理工学院担任博士后、曾任阿联酋起源人工智能研究院研究主管。研究方向为计算机视觉、认知计算和医学图像分析。在伪装场景理解方向上有突出成果,谷歌学术引用33,000+次,H指数62,7篇论文单篇引用超1300次(最高5900余次)。是CSIG杰出会员、CCF-CV执行委员,担任MIR/IEEE TIP (SCI 1区)编委、CVPR'23-26/NeurIPS'24-25/MICCAI'24-25领域主席,获得CCF优秀博士学位论文奖、吴文俊优秀青年奖、吴文俊人工智能科学技术奖自然科学二等奖(排四),2021-2024连续四年入选斯坦福全球前2%顶尖科学家榜单、入选2024和2025年斯坦福全球前2%“终身科学影响力榜单”。



论坛嘉宾




报告一:多模态推理模型及评测

报告人:赫然 研究员

中国科学院自动化研究所

讲者简介:

赫然,中科院自动化所多模态人工智能系统全国重点实验室研究员,IAPR/IEEE Fellow,IEEE TIFS副主编。从事人工智能、模式识别和计算机视觉研究。承担国家青年科学基金ABC类以及北京杰出青年科学基金等项目。在本领域国际主流期刊TPAMI和IJCV上发表论文23篇,第一作者11篇论文引用过百;研究工作获CAAI技术发明一等奖、CSIG自然科学一等奖、北京市科技进步二等奖等。指导学生获得IEEE SPS最佳青年论文奖、ICPR最佳科学论文奖、北京市优秀博士论文、中科院优秀博士论文、IEEE生物特征理事会优秀博士论文。曾/现任TIP资深编委、TPAMI\TCSVT\TBIOM\IJCV\PR\TMLR和自动化学报等国内外期刊编委,四次获最佳编委奖,以及NIPS\ICML\ICCV\CVPR\ECCV\ICLR\AAAI\IJCAI等会议领域主席。

报告简介:

近年来,以GPT-4o为代表的多模态基础大模型已成为新的研究热点,尤其是基于大语言模型进行多模态感知与推理,不断涌现的新能力显示出了通向通用人工智能的潜力。本报告梳理从大语言模型和视觉基础模型到多模态基础大模型的发展脉络,围绕多模态基础大模型的数据、评测、架构、训练和应用等方面展开全方位阐述,并探讨目前存在的问题以及未来的发展方向。


报告二:应用导向的多模态图像融合

报告人:马佳义 教授

武汉大学

讲者简介:

马佳义,武汉大学电信院教授、博导。研究方向为计算机视觉、信息融合等。发表CVPR、ICCV、IEEE TPAMI、IJCV、Cell等中科院一区/CCF A类论文200余篇,获钱学森论文奖、Information Fusion最佳论文奖,谷歌学术引用四万余次,H指数92。曾获湖北省自然科学一等奖(序1),担任Information Fusion、IEEE TIP、IEEE/CAA JAS等期刊AE。

报告简介:

图像融合技术旨在将来自不同源图像中的互补信息集成于一体,生成一幅能够全面表征成像场景的融合图像,从而显著提升目标识别、场景感知与环境理解的能力。本报告以应用导向的多模态图像融合为核心,剖析该领域当前面临的挑战与发展机遇,并系统介绍若干代表性方法。重点围绕未配准多模态图像融合、高低层视觉任务协同下的图像融合、具备退化鲁棒性与文本控制能力的图像融合等方向展开讨论,同时结合典型应用场景,展示其实际价值与广阔的应用前景。


报告三:无人系统多模态信息融合与智能感知

报告人:江俊君 教授 (MIR作者)

哈尔滨工业大学

讲者简介:

江俊君,哈尔滨工业大学计算学部长聘教授、博导,人工智能学院副院长,入选国家级青年人才计划。2014年12月于武汉大学计算机学院获得博士学位,2016年至2018年在日本国立情報学研究所担任特任研究员。研究方向主要包括图像处理、计算机视觉、深度学习。相关研究成果发表IEEE Transactions期刊论文和CCF A类会议论文百余篇,发表论文被谷歌学术引用2.2万次,H因子为67,入选全球高被引科学家、全球前0.05%顶尖科学家等榜单。担任Information Fusion期刊编委(2024年获最佳编委奖)、Fundamental Research和IEEE/CAA JAS期刊青年编委。曾获吴文俊人工智能优秀青年奖和中国计算机学会优秀博士论文奖。主持国家重点研发计划课题、国家自然科学基金联合重点/面上/青年项目。

报告简介:

近年来,由于深度学习技术的兴起和飞速发展,利用大规模标注数据进行监督学习在封闭场景的特定计算机视觉任务上的性能取得了突破性的进展,与此同时这些方法的性能也日趋饱和,其发展面临来自真实开放世界等应用挑战。针对野外环境下无人平台的多模态融合与感知这一重大需求,我们围绕小样本、弱标注、多源异构和跨场景等关键核心问题开展研究工作,将为复杂环境下无人平台的智能感知与自主决策提供技术支撑。报告将主要聚焦团队近年来在开放场景下的多模态信息融合与感知相关方面的主要研究成果。

相关论文:

哈工大江俊君团队 | SCNet:利用全1X1卷积实现轻量图像超分辨率

哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计


报告四:多模态脑信息融合及其在脑疾病诊疗中的应用

报告人:罗娜 副研究员 (MIR作者)

中国科学院自动化研究所

讲者简介:

罗娜,博士,中国科学院自动化研究所副研究员,硕导,脑网络组与脑机接口北京市重点实验室副主任,太原理工大学兼职教授。主要聚焦于多模态智能计算与精准精神医学交叉领域,重点开展基于人工智能的多源异构生物医学数据融合算法构建,及其在精神障碍客观诊疗体系构建中的转化应用。主持国家自然科学基金、国家重点研发计划子任务、博士后科学基金等多项科研项目。在包括Trends in cognitive Sciences, Ebiomedicine, The British Journal of Psychiatry等本领域重要期刊发表论文30余篇(第一或通讯作者论文16 篇)。曾入选中国科学院青年促进会培养计划、博士后创新人才支持计划等人才项目。现担任中国图象图形学学会脑图谱专委会委员,中国人工智能学会脑科学与人工智能专委会秘书长。

报告简介:

脑疾病的早期诊断和精准干预一直是临床研究的难点和重点,而多模态融合方法能够融合脑结构、脑功能、基因等跨模态的多源异构信息,为脑疾病的智慧诊疗提供了重要角度。本报告将首先总结面向精神疾病诊疗的常用多模态融合方法,以及如何融合多模态信息构建数字孪生脑,最后将介绍多模态融合方法在脑疾病诊断标记以及神经调控治疗靶点的应用。

相关论文:

欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用



论坛服务




扫码关注微信微信公众号"机器智能研究MIR”,获取最新讲座及论坛信息

论坛服务群:实时更新通知、发布直播回放等 (请备注: 论坛4)

论坛资料领取:扫描下方二维码,填写收件信息,即可免费领取一套论坛相关论文集


ICIG简介




国际图象图形学学术会议(ICIG)是中国图象图形学学会主办的最高级别的系列国际会议,迄今已经成功举办12届。中国图象图形学学会经过30余年的发展,充分利用丰富的学术资源和平台优势,凝聚图像图形领域知名专家,面向开放创新、交叉融合的发展趋势,为国内外图像图形相关领域的专家学者和产业界的同仁,搭建一个展示创新成果、展望未来发展的,集高度、深度、广度三位一体的交流平台。


第13届国际图象图形学学术会议(The 13th International Conference on Image and Graphics, ICIG 2025)将于2025年10月31日至11月2日在徐州宝信君澜度假酒店举办,会议由中国图象图形学学会主办,中国矿业大学承办,南京理工大学协办。


大会特邀沈向洋教授、Taku Komura教授、芮勇博士、周昆教授、Ajay Kumar教授、沈春华教授主旨报告。此次大会设置12场专题论坛,2场讲习班,100+ 论文分享与交流,为您带来精彩学术盛宴!同期,将举行中国图象图形学学会第九次会员代表大会。


会官网:https://icig.csig.org.cn






 END 




关于Machine Intelligence Research


Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区;2025年发布的最新影响因子达8.7,继续跻身JCR Q1区,最佳排名进入全球第6名;2025年一举进入中科院期刊分区表计算机科学二区。




往期目录
2025年第5期 | 生成式模型、疾病诊断、步态识别、行人再识别......
2025年第4期 | 特约专题: 具身智能
2025年第3期 | 大语言模型、医学图像分割、图像阴影去除、写作风格变化检测......
2025年第2期 | 常识知识获取、图因子分解机、横向联邦学习、分层强化学习...
2025年第1期 | 机器视觉、机器人、神经网络、反事实学习、小样本信息网络...
2024年第6期 | 图神经网络,卷积神经网络,生物识别技术...
2024年第5期 | 大语言模型,无人系统,统一分类与拒识...
2024年第4期 | 特约专题: 多模态表征学习
2024年第3期 | 分布式深度强化学习,知识图谱,推荐系统,3D视觉,联邦学习...
2024年第2期 | 大语言模型、零信任架构、常识知识推理、肿瘤自动检测和定位...
2024年第1期 | 特约专题: AI for Art
2023年第6期 | 影像组学、机器学习、图像盲去噪、深度估计...
2023年第5期 | 生成式人工智能系统、智能网联汽车、毫秒级人脸检测器、个性化联邦学习框架... (机器智能研究MIR)
2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习......
2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习... 
2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调
2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测... 



好文推荐
南洋理工大学肖佳平 等 | 基于深度强化学习的异构机器人系统目标搜索与导航
南开大学程明明团队 | MCANet:基于多尺度交叉轴注意力的医学图像分割
自动化所吴书 等 | GraphFM: 用于特征交互建模的图因子分解机
香港理工大学周立培团队等 | 综述: 面向以物体为中心的机器人操作的具身学习
清华大学朱军团队 | DPM-Solver++:用于扩散概率模型引导采样的快速求解器
南航张道强团队 | 综述:基于脑电信号与机器学习的注意力检测研究
可信图神经网络的全面综述:隐私性、鲁棒性、公平性和可解释性
哈工大江俊君团队 | SCNet:利用全1X1卷积实现轻量图像超分辨率
下载量TOP好文 | 人工智能领域高下载文章集锦(2023-2024年)
自动化所刘成林团队 | 统一分类与拒识: 一种一对多框架
上海交大张拳石团队 | 综述: 基于博弈交互理论的神经网络可解释性研究
专题好文 | 再思考人群计数中的全局上下文
专题好文 | Luc Van Gool团队: 基于分层注意力的视觉Transformer
浙江大学孔祥维团队 | 综述: 迈向真正以人为本的XAI
澳大利亚国立大学Nick Barnes团队 | 对息肉分割的再思考: 从分布外视角展开
前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查
精选好文 | 推荐系统的波纹知识图谱卷积网络
复旦邱锡鹏团队 | MOSS: 一个开源的对话式大语言模型
自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱
约翰霍普金斯大学Alan Yuille团队 | 从时序和高维数据中定位肿瘤的弱标注方法
专题综述 | 大语言模型中的知识生命周期
精选综述 | 零信任架构的自动化和编排: 潜在解决方案与挑战
欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用
金耀初团队&郑锋团队 | 综述: 深度工业图像异常检测
专题好文 | 创新视听内容的联合创作: 计算机艺术面临的新挑战
综述 | 清华张学工教授: 肺癌影像组学中的机器学习
哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计
Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪
贺威团队&王耀南院士团队 | 基于动态运动基元的机器人技能学习
乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器
上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法
西电公茂果团队 | 综述: 多模态数据的联邦学习
高文院士团队 | 综述: 大规模多模态预训练模型
前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究
港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法
南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)



MIR资讯
影响因子全球第6名!MIR稳步进军世界一流期刊行列
挺进Q1区前10名!MIR首个影响因子发布
喜报 | MIR 首次入选中科院期刊分区表计算机科学类二区
2025年 AI领域国际学术会议参考列表
致谢审稿人 | Machine Intelligence Research
MIR 2024年度优秀编委名单
喜报!MIR入选中国科技期刊卓越行动计划二期项目
特别提醒!请认准MIR官方渠道,谨防受骗
前进20名!MIR再度跻身国际影响力TOP期刊榜单
喜报 | MIR入选图像图形领域 T2级 “知名期刊”!
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录

图片



点击下方"阅读原文"观看往期论坛回放

内容中包含的图片若涉及版权问题,请及时与我们联系删除