- 简介本文介绍了GoodDrag,一种改善拖拽编辑稳定性和图像质量的新方法。与现有方法不同,GoodDrag引入了AlDD框架,在扩散过程中交替进行拖拽和去噪操作,有效提高了结果的保真度。我们还提出了一种信息保留的运动监督操作,以保持起始点的原始特征,以实现精确操作和减少伪影。此外,我们通过引入新的数据集Drag100并利用大型多模型开发专用的质量评估指标Dragging Accuracy Index和Gemini Score,为拖拽编辑的基准测试做出了贡献。广泛的实验表明,所提出的GoodDrag在质量和数量上都比现有技术更好。项目页面为https://gooddrag.github.io。
- 图表
- 解决问题论文旨在改善拖动编辑的稳定性和图像质量,避免现有方法中的畸变和累积扰动问题。
- 关键思路GoodDrag提出了一种交替使用拖动和去噪操作的AlDD框架,以有效提高结果的保真度。此外,论文还引入了信息保留的运动监督操作,以维护起始点的原始特征,实现精确操作和减少伪影。
- 其它亮点论文提出了一个新的数据集Drag100,并开发了Dragging Accuracy Index和Gemini Score等质量评估指标,使用大型多模型进行评估。实验结果表明,GoodDrag在质量和效果上都优于当前领域的其他方法。
- 在这个领域中,最近的相关研究包括:Deep Image Prior, Neural Style Transfer, Fast Style Transfer等。
沙发等你来抢
去评论
评论
沙发等你来抢