Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation

2024年03月12日
  • 简介
    在文本生成图像方面,使用描述不良图像特征的负面提示可以显著提高图像质量。然而,生成良好的负面提示是一项手动而繁琐的任务。为了解决这个问题,我们提出了NegOpt,一种新的方法,通过监督微调和强化学习来优化负面提示的生成,以增强图像生成。我们的综合方法使Inception Score增加了25%,超过了测试集的基准负面提示。此外,使用NegOpt,我们可以优先优化对我们最重要的指标。最后,我们构建了一个负面提示数据库(Negative Prompts DB)。
  • 图表
  • 解决问题
    论文旨在解决文本生成图像时需要手动生成负面提示的问题,提出了一种自动化生成负面提示的方法。
  • 关键思路
    论文提出了NegOpt方法,将有监督微调和强化学习相结合,优化生成负面提示的过程,从而提高图像生成的质量。
  • 其它亮点
    NegOpt方法可以显著提高Inception Score达25%,超过测试集中的ground-truth负面提示。同时,可以根据需求优化最重要的指标。此外,论文还构建了Negative Prompts DB数据集。
  • 相关研究
    与本文相关的研究包括:Generative Adversarial Networks (GANs)、VAE-GAN、Text-to-Image Generation、Negative Sampling等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论