AI生成图像的比较:DALL·E2 vs Midjourney

释放双眼,带上耳机,听听看~!
本文比较了AI生成图像的两种模型:DALL·E2和Midjourney,包括使用方法和效果对比,为您选择合适的模型提供参考。

AI生成图像的比较:DALL·E2 vs Midjourney

AI生成图像的比较:DALL·E2 vs Midjourney

随着 Diffusion Model 的普及,大家可能注意到互联网上有着铺天盖地的人工智能 (AI) 生成的图像,这些图像都是使用『文本到图像』的生成模型生成的:只需要输入一个文本描述(prompt/提示),AI 模型就可以在几秒几分钟内生成一个或多个精准匹配提示的精美图像

ShowMeAI在前序的文章中也做了一些相关的介绍:

AI生成图像的比较:DALL·E2 vs Midjourney

📘 你给文字描述,AI艺术作画,精美无比!附源码,快来试试!

AI生成图像的比较:DALL·E2 vs Midjourney

📘 使用Hugging Face发布的diffuser模型快速绘画

截止目前为止,三个最流行的AI作画产品是 📘Stable Diffusion、📘Midjourney和 📘DALL·E 2

AI生成图像的比较:DALL·E2 vs Midjourney

在本文中,ShowMeAI将对这3种模型进行比较,我们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在使用方法和效果对比。

💡 DALL·E2

📘DALL·E2由 📘OpenAI开发,目前产品版本处于 beta 阶段。

AI生成图像的比较:DALL·E2 vs Midjourney

💦 如何使用

① 文本提示作图

在 DALL·E2 中,可以使用 『文本到图像』和『文本引导的图像到图像』生成算法生成图像。 使用『文本引导的图像到图像』生成算法,您可以上传图像,AI会以你上传的图像为初始图,根据提示来作图。

AI生成图像的比较:DALL·E2 vs Midjourney

上图 DALL·E 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画)。

AI生成图像的比较:DALL·E2 vs Midjourney

② 文本提示的图到图

它还有『编辑生成的图像』功能,使用『文本引导图像到图像』生成算法,我们可以在已生成的图像之上生成另一个图像来扩展生成的图像,或者对有遮蔽的图像进行补全创作。

AI生成图像的比较:DALL·E2 vs Midjourney
AI生成图像的比较:DALL·E2 vs Midjourney

③ 分辨率和格式

在 DALL·E2 中,所有生成的图像都具有 1024 x 1024 的固定图像大小

💦 使用费用

首次访问 DALL·E 可以获得 50 个免费积分(要求在第一个月内用完)。 在接下来的每个月中,都会获得 15 个免费积分(对,同样的道理,免费积分不会累加)。

每1个提示默认会创建4个图像,消耗大约1个积分,你也可以付费花 15 美元购买 115 次作图。

💦 可否商用

对,我们可以商用 DALL·E2 生成的图像,官方的条款如下:

在遵守这些条款和我们的内容政策, 您可以将生成的图像用于任何合法目的,包括商业用途 。 这意味着您可以将您的权利出售给您创建的图像,将它们应用到书籍、网站和演示文稿等作品中,或者以其他方式将它们商业化。

💡 Midjourney

📘Midjourney 由同名研究实验室开发,目前处于公测阶段。

AI生成图像的比较:DALL·E2 vs Midjourney

💦 如何使用

生成图像 Midjourney ,您可以使用 📘Midjourney Discord 服务器

AI生成图像的比较:DALL·E2 vs Midjourney

① 文本提示作图

Midjourney的『文本提示做图』也非常简单,也同样是提交提示文本,就可以生成对应的结果。

AI生成图像的比较:DALL·E2 vs Midjourney

上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

② 图像变体&高分辨率

此外,您可以创建生成图像的其他变体或将生成的图像放大到更高分辨率。

AI生成图像的比较:DALL·E2 vs Midjourney

我们也可以输入一个或多个图像的 URL,以其作为初始,配以提示文本引导作图。

AI生成图像的比较:DALL·E2 vs Midjourney

分辨率和格式

Midjourney支持创建各种格式的图像,图像分辨率高达 2048 x 2048

💦 使用费用

首次加入 Midjourney Discord 服务器,我们可以获得 25 分钟的免费 GPU 时间,大致可以支撑 25 次免费生成(1次生成大概需要1 GPU 分钟)。单次请求将根据提示生成4个候选画作。

付费应用的费用如下:

  • 基本计划每月花费 10 美元,200 分钟 GPU 时间(每次图像生成大约 5 美分)
  • 标准计划每月花费 30 美元,15 小时 GPU 时间(每次图像生成大约 3 美分)

💦 可否商用

Midjourney允许付费会员将 Midjourney 生成的图像用于商业用途,具体的条款如下:

根据上述许可, 您拥有使用服务创建的所有资产 。 如果您属于以下例外情况,则不适用。 […]

如果您 不是付费会员,Midjourney 根据知识共享非商业性 4.0 署名国际许可(『资产许可』)授予您资产许可。

💡 Stable Diffusion

Stable Diffusion 由 📘CompVis、 📘Stability AI和 📘LAION开源,于 2022 年 8 月发布,大家都可以使用(但需要一些服务器计算资源支撑)。

AI生成图像的比较:DALL·E2 vs Midjourney

💦 如何使用

如果要本地运行 Stable Diffusion,至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有关如何使用 📘Stable Diffusion 教程

如果您不想编写和触碰任何代码,也可以使用 📘Dream Studio Web 应用程序,只需要注册一个帐户即可。

AI生成图像的比较:DALL·E2 vs Midjourney

① 文本提示做图

Dream Studio 提供 『文本到图像』,它具有各种选项,例如设置生成图像的步骤数或设置随机种子,可以设置单次生成的图像数量(1 到 9 之间)。

AI生成图像的比较:DALL·E2 vs Midjourney

上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

一个快捷尝试的方式是在 📘HuggingFace的 📘Diffuse the Rest应用里尝试,如下图所示:

AI生成图像的比较:DALL·E2 vs Midjourney

② 分辨率和格式

使用 Stable Diffusion,您可以创建各种格式的图像,图像分辨率高达 1024 x 1024。

💦 使用费用

首次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免费生成的额度。 免费试用后,您可以按 10 英镑的增量购买额外的积分。

💦 可否商用

可以在商业上使用 Stable Diffusion 生成的图像,相关的条款如下:

请注意,虽然用户已经丧失了这些图像的版权(以及任何/所有知识产权声明),但任何人都可以将其用于任何目的。 随意使用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图像用于任何用途, 包括商业目的

💡 总结

在本文中,我们比较了目前最流行的3个图像生成平台 DALL·E2、Midjourney、Stable Diffusion。对比的结果汇总如下表:

不过请大家注意,下表可能会发生变化,因为这三个模型正在积极开发中,功能也在不断完善。下方的信息来源时间点为2022年9月。

AI生成图像的比较:DALL·E2 vs Midjourney

参考资料

AI生成图像的比较:DALL·E2 vs Midjourney

本文正在参加「金石计划 . 瓜分6万现金大奖」

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

ChatGPT技术解析系列之:GPT3.5与Codex

2023-12-23 10:10:14

AI教程

LLM+LangChain+Stable Diffusion实现一句话自动生成图片的功能

2023-12-23 10:29:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索