ChatGPT and general-purpose AI count fruits in pictures surprisingly well

2024年04月12日
  • 简介
    目标计数是深度学习在各个领域中广受欢迎的任务,包括农业。传统的深度学习方法需要大量的训练数据,这在实际应用中常常是一个逻辑问题。为了解决这个问题,我们研究了ChatGPT(GPT4V)和一个通用的人工智能(用于物体计数的基础模型T-Rex)在100张图像中计算水果体(咖啡果)数量的表现。基础模型通过少量的领域特定学习表现优异,优于经过训练的YOLOv8模型(分别为R2 = 0.923和0.900)。ChatGPT也展示了一些有趣的潜力,特别是在应用人类反馈的少量学习时(分别为R2 = 0.360和0.460)。此外,我们还考察了实际应用所需的时间。使用基础模型和ChatGPT获得结果的时间远远短于YOLOv8模型(分别为0.83小时、1.75小时和161小时)。我们将这些结果解释为应用领域深度学习用户的两个惊喜:基础模型通过少量的领域特定学习可以大大节省时间和精力,而ChatGPT可以展示相对良好的表现。这两种方法都不需要编程技能,可以促进人工智能教育和传播。
  • 图表
  • 解决问题
    论文旨在解决目标计数在深度学习应用中需要大量训练数据的问题,并比较了 ChatGPT 和基于 T-Rex 的基础模型的表现。
  • 关键思路
    使用少量特定领域的数据进行少样本学习可以显著提高模型性能,同时ChatGPT也可以用于目标计数任务。
  • 其它亮点
    论文比较了基于少样本学习的基础模型和传统的深度学习方法,发现前者在时间和性能上都有优势;同时,论文还展示了ChatGPT在目标计数任务中的潜力,特别是在人类反馈下的少样本学习中。实验使用了100张咖啡樱桃图像,并比较了三种模型的性能和实现时间。
  • 相关研究
    在目标计数领域,最近的相关研究包括《Counting Everyday Objects in Everyday Scenes》和《A Survey of Deep Learning-Based Object Detection》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论