Position Paper: Towards Implicit Prompt For Text-To-Image Models

2024年03月04日
  • 简介
    最近的文本到图像(T2I)模型取得了巨大的成功,许多基准已经被提出来评估它们的性能和安全性。然而,它们只考虑了显式提示,而忽略了隐式提示(提示一个目标而不明确提及)。这些提示可能会消除安全约束,并对这些模型的应用构成潜在威胁。本文强调了T2I模型在隐式提示方面的当前状态。我们提出了一个名为ImplicitBench的基准,并对流行的T2I模型在隐式提示下的性能和影响进行了调查。具体而言,我们设计和收集了三个方面的2000多个隐式提示:通用符号、名人隐私和不适宜上班族(NSFW)问题,并评估了六个知名T2I模型在这些隐式提示下的能力。实验结果表明:(1)T2I模型能够精确地创建由隐式提示指示的各种目标符号;(2)隐式提示给T2I模型带来了潜在的隐私泄露风险;(3)在大多数评估的T2I模型中,NSFW的约束可以通过隐式提示绕过。我们呼吁T2I社区对隐式提示的潜力和风险加强关注,并进一步调查隐式提示的能力和影响,倡导一种平衡的方法,既利用其优点,又减轻其风险。
  • 图表
  • 解决问题
    论文试图评估当前文本生成图像模型在隐式提示下的表现和安全性,提出了一个名为ImplicitBench的基准测试,并呼吁对隐式提示的潜在风险进行更深入的研究。
  • 关键思路
    论文提出了一个基准测试ImplicitBench,用于评估当前文本生成图像模型在隐式提示下的表现和安全性。实验结果表明,隐式提示可能会绕过模型的安全限制,导致隐私泄露等潜在风险。
  • 其它亮点
    论文设计并收集了2000多个隐式提示,分为三个方面:通用符号、名人隐私和不适宜工作场所(NSFW)问题,并评估了六种知名的文本生成图像模型在这些隐式提示下的表现。实验结果表明,模型能够准确地创建各种隐含目标符号,并且隐式提示可能会带来隐私泄露的潜在风险。
  • 相关研究
    最近的相关研究包括:《A Survey of Text-to-Image Generation Techniques》、《Generative Adversarial Networks for Image and Video Synthesis: Algorithms and Applications》等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论