活动
论文
风云人物
专栏
项目
社交
取消
登录/注册
基于扩散模型的文本引导图像生成算法
CV
论文
苦行僧 2022-05-07 10:46 分享
苦行僧
帖子数:4719
个人主页
以下文章来源于mp.weixin.qq.com
DALL·E 2 之所以能够生成十分惊艳的图像,扩散模型功不可没,相比 GAN,该模型可以生成更多样,更高质量的图像(缺点在于计算量很大,需要反复迭代)。扩散模型的思想很简单,inference 的时候给定一个噪声信号作为输入,训练一个模型估计高斯噪声,用噪声减去这个预测的噪声,然后重复迭代以上操作直至恢复原始信号。理论上,可以用于语音合成、图像生成、超分辨率等
连续信号
的生成。
本文主要介绍扩散模型及其在图像生成领域的应用
,主要包括以下部分:
扩散模型(diffusion model)的原理
引导扩散模型 guided diffusion model(classifier-guidance, semantic-guidance, classifier-free-guidance)
GLIDE
DALL·E 2
内容中包含的图片若涉及版权问题,请及时与我们联系删除
点赞
收藏
评论
分享到Link
举报反馈
举报类型(必选)
样式问题
涉嫌广告
内容抄袭
内容侵权
政治相关
内容涉黄
其他
举报详情(选填)
0/200
沙发等你来抢
去评论
评论
请先
登录
后发表评论~
沙发等你来抢
评论
沙发等你来抢