- 简介目标计数是深度学习在各个领域中广受欢迎的任务,包括农业。传统的深度学习方法需要大量的训练数据,这在实际应用中常常是一个逻辑问题。为了解决这个问题,我们研究了ChatGPT(GPT4V)和一个通用的人工智能(用于物体计数的基础模型T-Rex)在100张图像中计算水果体(咖啡果)数量的表现。基础模型通过少量的领域特定学习表现优异,优于经过训练的YOLOv8模型(分别为R2 = 0.923和0.900)。ChatGPT也展示了一些有趣的潜力,特别是在应用人类反馈的少量学习时(分别为R2 = 0.360和0.460)。此外,我们还考察了实际应用所需的时间。使用基础模型和ChatGPT获得结果的时间远远短于YOLOv8模型(分别为0.83小时、1.75小时和161小时)。我们将这些结果解释为应用领域深度学习用户的两个惊喜:基础模型通过少量的领域特定学习可以大大节省时间和精力,而ChatGPT可以展示相对良好的表现。这两种方法都不需要编程技能,可以促进人工智能教育和传播。
- 图表
- 解决问题论文旨在解决目标计数在深度学习应用中需要大量训练数据的问题,并比较了 ChatGPT 和基于 T-Rex 的基础模型的表现。
- 关键思路使用少量特定领域的数据进行少样本学习可以显著提高模型性能,同时ChatGPT也可以用于目标计数任务。
- 其它亮点论文比较了基于少样本学习的基础模型和传统的深度学习方法,发现前者在时间和性能上都有优势;同时,论文还展示了ChatGPT在目标计数任务中的潜力,特别是在人类反馈下的少样本学习中。实验使用了100张咖啡樱桃图像,并比较了三种模型的性能和实现时间。
- 在目标计数领域,最近的相关研究包括《Counting Everyday Objects in Everyday Scenes》和《A Survey of Deep Learning-Based Object Detection》等。
沙发等你来抢
去评论
评论
沙发等你来抢