- 简介尽管图像生成技术取得了快速进展,但情感图像编辑方面仍未得到充分探索。图像的语义、上下文和结构可以唤起情感反应,因此情感图像编辑技术在各种实际应用中具有价值,包括治疗心理障碍、产品商业化和艺术设计。本文首次提出了一项新的情感唤起图像生成挑战,旨在合成能唤起目标情感的图像,同时保留原始场景的语义和结构。为了应对这一挑战,我们提出了一种扩散模型,能够有效地理解和编辑源图像以传达所需的情感和情绪。此外,由于缺乏情感编辑数据集,我们提供了一个独特的数据集,包含34万对图像及其情感注释。此外,我们进行了人类心理物理实验,并引入了四个新的评估指标,以系统地对所有方法进行基准测试。实验结果表明,我们的方法超越了所有竞争基线。我们的扩散模型能够从原始图像中识别情感线索,编辑出能引起所需情感的图像,同时保留了原始图像的语义结构。所有代码、模型和数据将公开发布。
- 图表
- 解决问题情感图像生成是一个尚未被充分探索的领域,本文提出了一种新的情感图像生成的挑战,旨在合成出能引发目标情感的图像,同时保留原始场景的语义和结构。
- 关键思路本文提出了一种扩散模型,能够有效地理解和编辑源图像,传达所需的情感和情绪。
- 其它亮点本文提供了一个包含340,000对图像和情感注释的独特数据集,并进行了人类心理物理实验,引入了四个新的评估指标来系统地评估所有方法。实验结果表明,本文的方法优于所有竞争基线。本文的扩散模型能够从原始图像中识别情感线索,编辑出引发所需情感的图像,同时保留原始图像的语义结构。所有代码、模型和数据都将公开。
- 最近的相关研究包括:1.《Image Generation from Scene Graphs》;2.《Semantic Image Synthesis with Spatially-Adaptive Normalization》;3.《Generative Adversarial Networks》等。
沙发等你来抢
去评论
评论
沙发等你来抢