Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

释放双眼，带上耳机，听听看~！

本周Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo，采用对抗扩散蒸馏技术，实现了即时生成高质量图像，引发行业热议。了解SDXL Turbo模型的技术原理和性能优势。

本周二，Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo，引发了一片叫好。人们纷纷表示，图像到文本生成从来没有这么轻松。

你可以不需要其他操作，只用在文本框中输入你的想法，SDXL Turbo 就能够迅速响应，生成对应内容。一边输入，一边生成，内容增加、减少，丝毫不影响它的速度。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

你还可以根据已有的图像，更加精细地完成创作。手中只需要拿一张白纸，告诉 SDXL Turbo 你想要一只白猫，字还没打完，小白猫就已经在你的手中了。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

SDXL Turbo 模型的速度达到了近乎「实时」的程度，让人不禁开始畅想:图像生成模型是不是可以干些其他事了。

有人直接连着游戏，获得了2fps 的风格迁移画面:

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

据官方博客介绍，在 A100上，SDXL Turbo 可在207毫秒内生成512×512图像（即时编码 + 单个去噪步骤 + 解码，fp16），其中单个 UNet 前向评估占用了67毫秒。

如此，我们可以判断，文生图已经进入「实时」时代。

这样的「即时生成」效率，与前不久爆火的清华 LCM 模型看起来有些相似，但是它们背后的技术内容却有所不同。Stability 在同期发布的一篇研究论文中详细介绍了该模型的内部工作原理。该研究重点提出了一种名为对抗扩散蒸馏（Adversarial Diffusion Distillation，ADD）的技术。SDXL Turbo 声称的优势之一是它与生成对抗网络(GAN)的相似性，特别是在生成单步图像输出方面。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

论文地址:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/65663480a92fba51d0e1023f/1701197769659/adversarial_diffusion_distillation.pdf

论文细节

简单来说，对抗扩散蒸馏是一种通用方法，可将预训练扩散模型的推理步数量减少到1-4个采样步，同时保持高采样保真度，并有可能进一步提高模型的整体性能。

为此，研究者引入了两个训练目标的组合:（i）对抗损失和(ii)与 SDS 相对应的蒸馏损失。对抗损失迫使模型在每次前向传递时直接生成位于真实图像流形上的样本，避免了其他蒸馏方法中常见的模糊和其他伪影。蒸馏损失使用另一个预训练(且固定)的扩散模型作为教师，有效利用其广泛知识，并保留在大型扩散模型中观察到的强组合性。在推理过程中，研究者未使用无分类器指导，进一步减少了内存需求。他们保留了模型通过迭代细化来改进结果的能力，这比之前基于 GAN 的单步方法具有优势。

训练步骤如图2所示:

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

表1介绍了消融实验的结果，主要结论如下:

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

接下来是与其他 SOTA 模型的对比，此处研究者没有采用自动化指标，而是选择了更加可靠的用户偏好评估方法，目标是评估 prompt 遵循情况和整体图像。

实验通过使用相同的 prompt 生成输出来比较多个不同的模型变体（StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL）。在盲测中，SDXL Turbo 以单步击败 LCM-XL 的4步配置，并且仅用4步击败 SDXL 的50步配置。通过这些结果，可以看到 SDXL Turbo 的性能优于最先进的 multi-step 模型，其计算要求显著降低，而无需牺牲图像质量。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

图7可视化了有关推理速度的 ELO 分数。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

表2比较了使用相同基础模型的不同 few-step 采样和蒸馏方法。结果显示，ADD 的性能优于所有其他方法，包括8步的标准 DPM 求解器。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

作为定量实验结果的补充，论文也展示了部分定性实验结果，展示了 ADD-XL 在初始样本基础上的改进能力。图3将 ADD-XL（1step）与 few-step 方案中当前最佳基线进行了比较。图4介绍了 ADD-XL 的迭代采样过程。图8将 ADD-XL 与其教师模型 SDXL-Base 进行了直接比较。正如用户研究所示，ADD-XL 在质量和 prompt 对齐方面都优于教师模型。

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

更多研究细节，可参考原论文。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

Stability AI推出新一代图像合成模型Stable Diffusion XL Turbo

Stability AI发布全新图像合成模型SDXL Turbo，实现即时生成

2024年生成式AI及云领域的五大趋势预测

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

Stability AI发布全新图像合成模型SDXL Turbo，实现即时生成

2024年生成式AI及云领域的五大趋势预测

Stability AI发布全新图像合成模型SDXL Turbo，实现即时生成

Stability AI 推出视频生成模型 Stable Video Diffusion，AI 行业迎来新转折

三星发布全新生成式AI模型Samsung Gauss，提升工作效率和用户体验

ChatGPT自拍照事件揭秘：AI模型随机生成Imgur链接导致网友恐慌