精准农业的发展推动了采摘机器人技术的进步,其核心视觉识别系统对提升农业自动化水平具有关键作用。本文综述了采摘机器人视觉识别技术的进展,涵盖图像采集技术、目标检测算法、空间定位策略及场景理解等内容。文章首先阐述了采摘机器人视觉系统的基本结构与功能,强调在自然农业环境中实现高效率、高精度识别的重要性。随后分析了各类图像处理技术与视觉算法,包括彩色图像分析、三维深度感知,以及融合机器学习与深度学习算法的自动目标识别技术。同时,论文着重指出现有技术在动态光照、遮挡问题、果实成熟度多样性及实时处理能力方面面临的挑战。本文进一步探讨了多传感器信息融合技术,论述了将视觉识别与机器人控制系统结合以提高采摘精度与作业速率的方法。此外,本文还介绍了创新性研究成果,如应用卷积神经网络(CNNs)实现精准果实检测,开发基于事件的视觉系统以提升系统响应速度等。文末预测了采摘机器人视觉识别技术的未来发展方向,提出算法精细化、硬件创新化及技术对不同农业条件适应性的新型研究趋势。王耀南院士团队旨在为农业机器人领域的研究者与实践者提供视觉识别技术的综合分析框架,涵盖当前成就、现存挑战与未来发展前景。

全文下载:

Key Technologies for Machine Vision for Picking Robots: Review and Benchmarking

Xu Xiao, Yiming Jiang, Yaonan Wang

https://link.springer.com/article/10.1007/s11633-024-1517-1

https://www.mi-research.net/article/doi/10.1007/s11633-024-1517-1

 

全文导读

在现代农业的快速发展中,采摘机器人作为提升生产效率、降低人力成本、改善作业质量的关键技术,正逐渐成为研究焦点。这些智能系统通过模拟人类的感知、决策与行动过程,能够在多种作物中识别并采摘成熟果实,同时避免对作物的损伤或漏采。作为采摘机器人的核心组件,视觉系统承担着感知与理解环境的重要任务,既需要在变化的自然环境中准确识别目标果实,又必须实时处理大量数据以实现高效精准的农事作业。

 

然而,由于农业环境的复杂性,采摘机器人的视觉系统面临诸多挑战。光照条件的变化、果实间的相互遮挡、不同成熟度果实外观的差异等,均对视觉系统的识别能力提出了更高要求。此外,实时性需求也对系统的处理速度与算法效率形成挑战。针对这些难题,研究者们不断探索新型图像处理技术与计算机视觉算法,例如利用机器学习与深度学习提升识别精度、采用多传感器数据融合增强环境感知能力,以及开发具备更强实时性的算法以应对动态采摘需求。

 

环境感知能力是采摘机器人实现功能的核心要素。本文探讨了检测与定位园艺果蔬目标所需的各类传感器技术与图像处理策略,并对其精度、速度及鲁棒性进行了评估。这些视觉系统在识别与定位果蔬时的效能因作物类型而异,且受光照条件、遮挡等多种因素影响。文章系统梳理了当前采摘机器人环境感知技术的研究现状,剖析该领域固有的挑战及未来可能的发展路径。鉴于农业环境具有非结构化、复杂多变的特性,相关系统需具备更高可靠性与快速响应能力。在环境感知传感器性能、多源传感器数据融合、机器视觉与机械容错性提升等方面亟待重大研究突破。这些技术与方法层面的进步对推动采摘机器人环境感知技术的持续革新至关重要,从而强化智慧农业的发展驱动力。

 

本文系统回顾了采摘机器人视觉系统的构成与功能,探讨了图像处理与目标识别技术的当前进展,分析了现有技术面临的挑战,并展望了未来技术发展方向。通过这一综述,团队旨在为领域内的研究者与工程师提供关于技术现状与未来趋势的全面分析,以推动采摘机器人技术的进一步发展与应用。

 

· 本文作者 ·

全文下载:

Key Technologies for Machine Vision for Picking Robots: Review and Benchmarking

Xu Xiao, Yiming Jiang, Yaonan Wang

https://link.springer.com/article/10.1007/s11633-024-1517-1

https://www.mi-research.net/article/doi/10.1007/s11633-024-1517-1

BibTex:

@Article{MIR-2024-05-132,

author={Xu Xiao and Yiming Jiang and Yaonan Wang},

journal={Machine Intelligence Research},

title={Key Technologies for Machine Vision for Picking Robots: Review and Benchmarking},

year={2025},

volume={22},

issue={1},

pages={2-16},

doi={10.1007/s11633-024-1517-1}}

 

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区。

往期目录
2025年第2期 | 常识知识获取、图因子分解机、横向联邦学习、分层强化学习...
2025年第1期 | 机器视觉、机器人、神经网络、反事实学习、小样本信息网络...
2024年第6期 | 图神经网络,卷积神经网络,生物识别技术...
2024年第5期 | 大语言模型,无人系统,统一分类与拒识...
2024年第4期 | 特约专题: 多模态表征学习
2024年第3期 | 分布式深度强化学习,知识图谱,推荐系统,3D视觉,联邦学习...
2024年第2期 | 大语言模型、零信任架构、常识知识推理、肿瘤自动检测和定位...
2024年第1期 | 特约专题: AI for Art
2023年第6期 | 影像组学、机器学习、图像盲去噪、深度估计...
2023年第5期 | 生成式人工智能系统、智能网联汽车、毫秒级人脸检测器、个性化联邦学习框架... (机器智能研究MIR)
2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习......
2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习... 
2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调
2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测... 
2022年第6期 | 因果推理、视觉表征学习、视频息肉分割...
2022年第5期 | 重磅专题:类脑机器学习
2022年第4期 | 来自苏黎世联邦理工学院Luc Van Gool教授团队、清华大学戴琼海院士团队等
2022年第3期 | 聚焦自然语言处理、机器学习等领域;来自复旦大学、中科院自动化所等团队
2022年第2期 | 聚焦知识挖掘、5G、强化学习等领域;来自联想研究院、中科院自动化所等团队
主编谭铁牛院士寄语, MIR第一期正式出版!

 

 

好文推荐
可信图神经网络的全面综述:隐私性、鲁棒性、公平性和可解释性
哈工大江俊君团队 | SCNet:利用全1X1卷积实现轻量图像超分辨率
下载量TOP好文 | 人工智能领域高下载文章集锦(2023-2024年)
自动化所刘成林团队 | 统一分类与拒识: 一种一对多框架
上海交大张拳石团队 | 综述: 基于博弈交互理论的神经网络可解释性研究
专题好文 | 再思考人群计数中的全局上下文
专题好文 | Luc Van Gool团队: 基于分层注意力的视觉Transformer
浙江大学孔祥维团队 | 综述: 迈向真正以人为本的XAI
澳大利亚国立大学Nick Barnes团队 | 对息肉分割的再思考: 从分布外视角展开
前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查
精选好文 | 推荐系统的波纹知识图谱卷积网络
复旦邱锡鹏团队 | MOSS: 一个开源的对话式大语言模型
自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱
约翰霍普金斯大学Alan Yuille团队 | 从时序和高维数据中定位肿瘤的弱标注方法
专题综述 | 大语言模型中的知识生命周期
精选综述 | 零信任架构的自动化和编排: 潜在解决方案与挑战
欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用
金耀初团队&郑锋团队 | 综述: 深度工业图像异常检测
专题好文 | 创新视听内容的联合创作: 计算机艺术面临的新挑战
下载量TOP好文 | 人工智能领域高下载文章集锦 (2022-2023年)
引用量TOP好文 | 人工智能领域高引用文章集锦 (2022-2023年)
综述 | 清华张学工教授: 肺癌影像组学中的机器学习
哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计
Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪
贺威团队&王耀南院士团队 | 基于动态运动基元的机器人技能学习
乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器
上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法
西电公茂果团队 | 综述: 多模态数据的联邦学习
高文院士团队 | 综述: 大规模多模态预训练模型
前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究
港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法
南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)
Luc Van Gool团队 | 深度学习视角下的视频息肉分割
专题综述 | 高效的视觉识别: 最新进展及类脑方法综述
北大黄铁军团队 | 专题综述:视觉信息的神经解码
专题综述 | 迈向脑启发计算机视觉的新范式
专题好文 | 新型类脑去噪内源生成模型: 解决复杂噪音下的手写数字识别问题
戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络
ETH Zurich重磅综述 | 人脸-素描合成:一个新的挑战
华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算
东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法
联想CTO芮勇团队 | 知识挖掘:跨领域的综述
复旦邱锡鹏团队 | 综述:自然语言处理中的范式转换

 

 

MIR资讯
挺进Q1区前10名!MIR首个影响因子发布
喜报 | MIR 首次入选中科院期刊分区表计算机科学类二区
2025年 AI领域国际学术会议参考列表
致谢审稿人 | Machine Intelligence Research
MIR 2024年度优秀编委名单
喜报!MIR入选中国科技期刊卓越行动计划二期项目
专题征稿 | 生成式人工智能的安全与伦理
专题征稿 | Special Issue on Subtle Visual Computing
征稿启事 | AIART 2025 Call for Papers
专题征稿 | 用于视频理解的多模态学习、时序建模及基础模型
专题征稿 | Special Issue on Embodied Intelligence
特别提醒!请认准MIR官方渠道,谨防受骗
年终喜报!MIR科技期刊世界影响力指数跻身Q1区 (含100份龙年礼包)
前进20名!MIR再度跻身国际影响力TOP期刊榜单
喜报 | MIR入选图像图形领域 T2级 “知名期刊”!
双喜!MIR入选”2022中国科技核心期刊”,并被DBLP收录 | 机器智能研究MIR
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录

内容中包含的图片若涉及版权问题,请及时与我们联系删除