Make Me Happier: Evoking Emotions Through Image Diffusion Models

2024年03月13日
  • 简介
    尽管图像生成技术取得了快速进展,但情感图像编辑方面仍未得到充分探索。图像的语义、上下文和结构可以唤起情感反应,因此情感图像编辑技术在各种实际应用中具有价值,包括治疗心理障碍、产品商业化和艺术设计。本文首次提出了一项新的情感唤起图像生成挑战,旨在合成能唤起目标情感的图像,同时保留原始场景的语义和结构。为了应对这一挑战,我们提出了一种扩散模型,能够有效地理解和编辑源图像以传达所需的情感和情绪。此外,由于缺乏情感编辑数据集,我们提供了一个独特的数据集,包含34万对图像及其情感注释。此外,我们进行了人类心理物理实验,并引入了四个新的评估指标,以系统地对所有方法进行基准测试。实验结果表明,我们的方法超越了所有竞争基线。我们的扩散模型能够从原始图像中识别情感线索,编辑出能引起所需情感的图像,同时保留了原始图像的语义结构。所有代码、模型和数据将公开发布。
  • 图表
  • 解决问题
    情感图像生成是一个尚未被充分探索的领域,本文提出了一种新的情感图像生成的挑战,旨在合成出能引发目标情感的图像,同时保留原始场景的语义和结构。
  • 关键思路
    本文提出了一种扩散模型,能够有效地理解和编辑源图像,传达所需的情感和情绪。
  • 其它亮点
    本文提供了一个包含340,000对图像和情感注释的独特数据集,并进行了人类心理物理实验,引入了四个新的评估指标来系统地评估所有方法。实验结果表明,本文的方法优于所有竞争基线。本文的扩散模型能够从原始图像中识别情感线索,编辑出引发所需情感的图像,同时保留原始图像的语义结构。所有代码、模型和数据都将公开。
  • 相关研究
    最近的相关研究包括:1.《Image Generation from Scene Graphs》;2.《Semantic Image Synthesis with Spatially-Adaptive Normalization》;3.《Generative Adversarial Networks》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论