智能科学创新讲堂·AI新锐系列由国际人工智能期刊Machine Intelligence Research (MIR)主办,分若干专题,聚焦机器智能领域的最新进展与前沿探索,面向全球青年学者,定期邀请他们分享在人工智能顶级会议或权威期刊上发表的代表性成果。讲堂旨在搭建一个展示青年科研力量、促进跨机构与跨学科交流的平台,激发智能科学领域的创新思维与学术合作,推动青年人才成长与前沿研究传播。
智能科学创新讲堂·总第二十四讲
“隐性视觉感知”专题
智能科学创新讲堂本期聚焦"隐性视觉感知"专题。"隐性视觉感知"专题专注于伪装目标检测、透明物体分割、阴影检测等隐性视觉感知前沿研究,并积极探索其在医疗影像(如息肉检测)等领域的应用拓展。旨在让这个重要而富有挑战性的研究主题更加活跃,通过开放的学术交流不断迸发新的思想火花,推动学术社区繁荣和领域持续进步,促进计算机视觉与医疗影像等交叉领域的深入交流与合作,逐步打通不同应用场景的技术壁垒。
南京航空航天大学李文通副教授将开启本专题本年度第一场分享会,牛津大学田昕博士担纲主持。2026年4月16日(周四) 15:00,四大平台同步直播,诚邀您预约收看!
往期分享回放:
https://space.bilibili.com/583634554/lists/697159?type=series


牛津大学博士后研究员,专注于多模态医学影像融合、跨模态转换及结构化建模研究,成果发表于MICCAI、ISBI等顶会。现任牛津团队AI4Healthcare负责人,联合临床与工业界开展疾病亚型识别、生物标志物挖掘及精准医学应用。
分享主题:
复杂感知挑战: 多模态基础模型驱动的感知新范式
分享人:


李文通,南京航空航天大学副教授。研究方向为计算机视觉、具身智能,在CCF-A类期刊/会议发表论文26篇,谷歌学术引用 1900 余次。主持国家自然科学基金青年项目、参与新一代人工智能国家科技重大专项课题。获浙江省优秀博士学位论文,担任ICLR/NeurIPS领域主席。
MIR计算机视觉相关文章推荐:
https://www.mi-research.net/en/topic?id=424dd21b-9fbb-468c-abb9-213d9898bb22
本报告分享一种名为CT-CIG 的文本引导可控扩散生成方法,来解决现有伪装图像生成方法中存在的忽视伪装物体与背景环境逻辑关系、导致生成结果缺乏自然真实感的问题。方法通过视觉语言模型构建高质量图文数据,设计“伪装揭示对话机制”生成文本提示,并结合二值掩码实现准确几何控制。同时引入频率交互细化模块增强纹理细节、减少伪影。实验在LAKE-RED 和 COD10K 上表明,该方法在 FID、KID 和 CLIP Score 等指标上优于多种先进方法。
直播通道①:
哔哩哔哩APP搜索"中科院自动化所”或扫描下方二维码,直播当天点击头像即可进入
直播通道②:中国科学院自动化研究所 视频号
点击下方红色"预约"按钮即可预约观看当天直播
直播通道③:机器智能研究MIR 视频号
点击下方红色"预约"按钮即可预约观看当天直播
直播通道④:蔻享学术
点击下方链接进入"智能科学创新讲堂"主题页,直播当天选择相应直播即可观看
https://www.koushare.com/homepage/332528

微信微信公众号"机器智能研究MIR”(发布最新讲座资料)


直播群:实时更新通知 (请备注: 研究方向+姓名)


MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!
说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737
收件信息登记:
https://lcn76mgd97vz.feishu.cn/share/base/form/shrcnsQ6cmRjqoxPF5WDowSBFVr
点击“阅读原文”观看往期回放
内容中包含的图片若涉及版权问题,请及时与我们联系删除



评论
沙发等你来抢