- 简介最近,人们已经认识到大型语言模型在各种智力任务中表现出高水平的性能。然而,很少有研究调查它们在涉及感性的行为方面与人类的一致性,例如审美评价。本研究调查了能够处理图像输入的最先进的语言模型GPT-4 with Vision在图像审美评价任务上的表现。我们采用了两个任务,预测一个群体的平均评价值和一个个体的评价值。我们通过探索提示和分析预测行为来研究GPT-4 with Vision的表现。实验结果揭示了GPT-4 with Vision在预测审美评价方面的卓越表现以及对美丽和丑陋的不同反应的性质。最后,我们讨论了基于人类对美感知识的科学知识,采用将传统的深度学习模型与大型语言模型集成的代理技术,开发审美评价的AI系统。
-
- 图表
- 解决问题研究GPT-4与图像处理的联合应用在审美评价上的表现,探究其在个体和群体评价中的表现。
- 关键思路通过探索提示和分析预测行为,研究GPT-4与Vision模型在审美评价上的表现,利用科学知识开发基于代理技术的AI系统。
- 其它亮点实验结果表明,在预测审美评价方面,GPT-4与Vision模型表现优异,同时发现美丑的不同反应性质。实验使用了图像数据集和语言数据集,并且提供了开源代码。
- 最近的相关研究包括:'Visual Sentiment Analysis: A Survey of the State-of-the-Art'、'Aesthetic Quality Inference Engine for Artistic Images'等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流