每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
Optimal camera-robot pose estimation in linear time from points and lines
Guangyang Zeng ,
Biqiang Mu ,
Qingcheng Zeng ,
...
2024年07月23日
相机位姿估计是机器人领域中的一个基本问题。本文关注两个问题:首先,点和线特征具有互补优势,因此设计一个可以有效融合它们的统一算法非常有价值;其次,随着现代前端技术的发展,单张图像中可能存在大量特征点和特征线,这为高精度的机器人位姿估计提供了潜力。基于这些观察,我们提出了一种名为AOPnP(L)的算法,它是一种从点和线估计相机-机器人位姿的最优线性时间算法。具体来说,我们用线上的两个不同点表示一条直线,并统一了点和线测量的噪声模型,其中噪声被添加到图像中的2D点。通过利用Plucker坐标对线进行参数化,我们为组合点和线测量制定了最大似然(ML)问题。为了最优地解决ML问题,AOPnP(L)采用了两步估计方案。在第一步中,通过消除偏差,设计出一个可以收敛到真实位姿的一致估计。在第二步中,执行单个高斯-牛顿迭代来优化初始估计。AOPnP(L)具有理论上的最优性,其均方误差收敛于Cramer-Rao下界。此外,它具有线性时间复杂度。这些特性使它非常适合于对精度有要求且需要实时机器人位姿估计的应用。我们进行了大量实验证明了我们的理论成果,并展示了AOPnP(L)在静态定位和动态里程计系统中的优越性。
24
热度
Rob
PDF
解读
Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation
Marcel Torne ,
Anthony Simeonov ,
Zechu Li ,
...
2024年03月06日
模仿学习方法需要大量的人类监督才能学习到对物体姿态、物理干扰和视觉干扰变化具有鲁棒性的策略。相反,强化学习可以自主地探索环境以学习具有鲁棒性的行为,但可能需要大量不安全的真实世界数据收集,这是不切实际的。为了在不需要大量不安全的真实世界数据收集或广泛的人类监督的情况下学习性能良好、具有鲁棒性的策略,我们提出了RialTo。RialTo是一个系统,通过在“数字孪生”模拟环境中进行强化学习来增强现实世界中的模仿学习策略,该模拟环境是根据少量真实世界数据即时构建的。为了实现这种从真实世界到模拟世界再到真实世界的管道,RialTo提出了一个易于使用的界面,可以快速扫描和构建真实世界环境的数字孪生。我们还介绍了一种新颖的“反向蒸馏”程序,用于将真实世界演示带入模拟环境进行高效微调,最小化人类干预和工程所需。我们在真实世界中评估了RialTo在各种机器人操作问题上的表现,例如在架子上稳定地堆叠盘子,在书架上放置书籍和其他六个任务。RialTo提高了(超过67%)策略的鲁棒性,而无需进行广泛的人类数据收集。项目网站和视频请参见https://real-to-sim-to-real.github.io/RialTo/。
Rob
AI
ML
PDF
解读
Testing Large Language Models on Driving Theory Knowledge and Skills for Connected Autonomous Vehicles
Zuoyin Tang ,
Jianhua He ,
Dashuai Pei ,
...
2024年07月24日
自动驾驶汽车(AVs)面临的主要挑战之一是处理长尾角落案例。虽然大型语言模型(LLMs)具有处理角落案例的巨大潜力,具有出色的泛化和解释能力,并且在应用于自动驾驶方面越来越受到研究关注,但仍然存在技术障碍,例如LLMs的严格模型性能和巨大的计算资源需求。在本文中,我们研究了一种新的方法,即应用远程或边缘LLMs来支持自动驾驶。这种LLM辅助驾驶系统的关键问题是评估LLMs对驾驶理论和技能的理解,确保它们有资格承担CAV的安全关键驾驶辅助任务。我们为几个专有LLM模型(OpenAI GPT模型、Baidu Ernie和Ali QWen)和开源LLM模型(清华MiniCPM-2B和MiniCPM-Llama3-V2.5)设计并运行了驾驶理论测试,其中包括500多个多选理论测试问题。实验从模型准确性、成本和处理延迟等方面进行了测量。实验结果表明,虽然模型GPT-4通过了测试并具有改进的领域知识,而Ernie的准确度为85%(略低于86%的及格门槛),但其他LLM模型,包括GPT-3.5,未通过测试。对于带有图像的测试问题,多模态模型GPT4-o具有96%的优秀准确性结果,而MiniCPM-Llama3-V2.5的准确度为76%。虽然GPT-4在CAV驾驶辅助应用方面具有更强的潜力,但使用GPT-4模型的成本要高得多,几乎是使用GPT3.5的50倍。这些结果可以帮助决定是否使用现有的LLMs进行CAV应用,并在模型性能和成本之间平衡。
AI
cs.NI
Rob
PDF
解读