OpenAI开源新模型代码库Consistency Models，无需对抗训练即可快速获得高质量样本

本次OpenAI发布了一致性模型的实现代码库。

OpenAI 的这项研究主要是图像生成方面的，大家或多或少的都听过这项技术，例如最近热门的 Midjourney 和 Stable Diffusion，它们大都采用扩散模型，由于其生成的图片效果惊艳，很多人都将其视为最好的工具。但扩散模型依赖于迭代生成过程，这导致此类方法采样速度缓慢，进而限制了它们在实时应用中的潜力。

OpenAI 的这项研究就是为了克服这个限制，提出了 Consistency Models，这是一类新的生成模型，无需对抗训练即可快速获得高质量样本。与此同时，OpenAI 还发布了 Consistency Models 实现以及权重。

此前报告相关论文链接：https://hub.baai.ac.cn/view/24651

项目地址：https://github.com/openai/consistency_models

Consistency Models一致性模型

Yang Song, P Dhariwal, M Chen,Ilya Sutskever

[OpenAI]

一作是在OpenAI担任研究员的宋飏，14岁时，曾以17位评委全票通过的成绩，入选“清华大学新百年领军计划”。在次年高考中，他又成为连云港市理科状元，考入清华。2016年，宋飏从清华大学数理基础科学班毕业，此后赴斯坦福深造。2022年，宋飏获斯坦福计算机科学博士学位，而后加入OpenAI。在博士期间，他的一作论文“Score-Based Generative Modeling through Stochastic Differential Equations”还获得过ICLR 2021的杰出论文奖。宋飏将于 2024 年 1 月加入加州理工学院电子系（Electrical Engineering）和计算数学科学系（Computing and Mathematical Sciences）担任助理教授。

此外还包括 OpenAI 联合创始人、首席科学家 Ilya Sutskever。

一致性模型代码库介绍

该存储库包含一致性模型的代码库，使用 PyTorch 实现，用于在 ImageNet-64、LSUN Bedroom-256 和 LSUN Cat-256 上进行大规模实验。我们的存储库基于openai/guided-diffusion，它最初是在 MIT 许可下发布的。我们的修改支持一致性蒸馏、一致性训练以及本文中讨论的几种采样和编辑算法。

CIFAR-10 实验的存储库位于 JAX 中，将单独发布。

预训练模型

我们已经发布了论文中主要模型的检查点。在使用这些模型之前，请查看相应的模型卡以了解这些模型的预期用途和限制。

以下是每个模型检查点的下载链接：

ImageNet-64 上的 EDM：edm_imagenet64_ema.pt
具有 l2 指标的 ImageNet-64 上的 CD：cd_imagenet64_l2.pt
具有 LPIPS 指标的 ImageNet-64 上的 CD：cd_imagenet64_lpips.pt
ImageNet-64 上的 CT：ct_imagenet64.pt
LSUN Bedroom-256 上的 EDM：edm_bedroom256_ema.pt
LSUN Bedroom-256 上的 CD，l2 公制：cd_bedroom256_l2.pt
LSUN Bedroom-256 上的 CD，LPIPS 指标：cd_bedroom256_lpips.pt
LSUN Bedroom-256 上的 CT：ct_bedroom256.pt
LSUN Cat-256 上的 EDM：edm_cat256_ema.pt
LSUN Cat-256 上的 CD，具有 l2 公制：cd_cat256_l2.pt
CD on LSUN Cat-256 with LPIPS metric: cd_cat256_lpips.pt
LSUN Cat-256 上的 CT：ct_cat256.pt

依赖关系

要安装此代码库中的所有包及其依赖项，请运行

pip install -e .

模型训练和抽样

我们在cm/scripts/launch.sh中提供了 EDM 训练、一致性蒸馏、一致性训练、单步生成和多步生成的示例。

评价

为了比较不同的生成模型，我们使用 FID、Precision、Recall 和 Inception Score。这些指标都可以使用存储在 (numpy) 文件中的样本批次来计算.npz。可以使用cm/evaluations/evaluator.py以与 openai/guided-diffusion中描述的相同方式评估样本，其中提供了参考数据集批次。

引用

如果您发现此方法和/或代码有用，请考虑引用

@article{song2023consistency,
  title={Consistency Models},
  author={Song, Yang and Dhariwal, Prafulla and Chen, Mark and Sutskever, Ilya},
  journal={arXiv preprint arXiv:2303.01469},
  year={2023},
}

作为一个图像生成AI，一致性模型（Consistency Model）最大的特点在于快又好。

相比扩散模型，它主要有两大优势：

其一，无需对抗训练（adversarial training），就能直接生成高质量的图像样本。

其二，相比扩散模型可能需要几百甚至上千次迭代，一致性模型只需要一两步就能搞定多种图像任务——

包括上色、去噪、超分等，都可以在几步之内搞定，而不需要对这些任务进行明确训练。（当然，如果进行少样本学习的话，生成效果也会更好）。

内容中包含的图片若涉及版权问题，请及时与我们联系删除