Midjourney:Discord 社区如何成就 AI 绘画独角兽?

9

当今炙手可热的文生图技术,Midjourney 绝对是绕不开的名字。它深深扎根于 Discord 社区,因此,本文将结合作者的使用体验和思考,以 Discord 为切入点,对 Midjourney 进行深入探讨。

一、 初识 Midjourney

  1. Midjourney 究竟是什么?

Midjourney 官方的定义是:一个独立的研究实验室,致力于探索新的思维媒介,拓展人类的想象力。他们的重点在于设计、人机交互和人工智能。目前我们所见的是其文生图产品,但未来形态可能会有更多可能性。

进入其官网,会发现一个醒目的“Join in the beta”按钮,点击后会直接跳转到 Midjourney 在 Discord 上的频道。截至目前,已有超过 380 万用户加入了该频道。

Midjourney 的大部分工作,包括最核心的图像生成,都是通过 Discord 来完成的。用户通过提交 Prompt(提示词),由 Midjourney 的 Bot 生成图像。

此外,Midjourney 还利用 Bot 机制完成其他任务,例如:

  • 将用户生成的图片同步到官网的个人中心;
  • 通过官网收取订阅费,并授予用户相应的使用次数。

后文将简要介绍 Discord,以便大家更好地理解 Midjourney 与 Discord 之间的共生关系。

  1. 创始人 David Holz

David Holz 是一位连续创业者,曾就职于 NASA 和 Max Planck 研究所,拥有流体力学博士学位。他创立了 Leap Motion 公司,后又创立 Midjourney。

Holz 对 Midjourney 的愿景是:

“Midjourney 不仅仅是想象力的引擎,更是通往未来的阶梯。面对 AI 生成的大量图像,我感到自己仿佛置身于深不见底的池塘边,明知不会游泳,却能感受到池塘的深度。

AI 就像水,人们常常将其视为洪水猛兽,这是错误的。水既有危险性,也是文明的驱动力。人类如果能学会与水共处,生活将会更加美好。

Midjourney 便是这样一股新的水源。”

  1. Midjourney 的未来走向?

Midjourney 正在进行许多不同的项目,致力于成为一个多元化的研究实验室,探索reflection, imagination, and coordination等主题。图像生成是目前最受关注的领域。

Midjourney 认为,其目标并非单纯的艺术创作或制造 deepfakes,而是拓展人类物种的想象力。当计算机在视觉想象力方面超越 99% 的人类时,这意味着什么?

但这并不意味着人类会停止想象。汽车比人类跑得快,但这并不意味着我们不再步行。当我们需要长距离运输大量物品时,就需要引擎,无论是飞机、轮船还是汽车。

Midjourney 希望将这项技术打造为想象力的引擎,它将是一件积极且以人为本的事情。

二、 Discord 成就 Midjourney

创始人 David Holz 曾表示,很多人问他们为什么不做一款 iOS App 来生成图片?因为人们希望共同创造,而在 iOS 上实现这一点,就必须建立自己的社交网络,这非常困难。Discord 在这方面做得很好,它是一个非常棒的实现介质。

这种选择帮助 Midjourney 实现了快速增长。在深入探讨之前,我们先来了解一下 Discord。

  1. Discord 是什么?

Discord 于 2015 年上线,最初专注于游戏语音连麦。它基于 Voip 技术,具有多端支持(特别是网页端)、免费、上手门槛低、语音清晰、延时低、连接稳定等特点,逐渐获得了用户的认可。

疫情之后,Discord 的社区功能开始崭露头角,突破了游戏领域。例如,它成为了欧洲许多高校的线上教学工具。

Discord 本质上是一个社区,语音只是其主打功能之一。

Discord 的两位创始人表示:“Discord 与大多数在线社交工具完全不同,它没有游戏化系统,没有追随者人数,没有算法推荐。它只是创造了一个地方,让你感觉就像你的朋友就在身边,你遇到他们并与他们交谈、闲聊。”

用户可以非常便捷地创建服务器,并在服务器上设立不同的频道,可以理解为频道是不同的主题房间。

另一个关键点是,Discord 拥有 Bot 机制,你可以将其理解为机器人或插件,允许第三方在 Discord 提供的接口下进行独立开发。

这极大地扩展了社区的功能,增加了用户的粘性,并且支持开放邀请 Bot 加入频道的功能(Midjourney 也支持了邀请功能)。

Midjourney 通过在 Discord 上创建了自己的服务器,并创建了大量的频道,以及开发了自己的机器人,来向用户提供服务。

  1. 如何在 Discord 中使用 Midjourney?

我们来简单分享一下如何在 Discord 中使用 Midjourney,方便一些无法访问的朋友更好地理解:

首先需要注册一个 Discord 账号,然后进入新手的 newbie 频道就可以快速生成图片:

在 newbie 频道中,“/” 可以调出所有的命令:

当你输入 /imagine + 提示词,再回车后,就相当于把 Prompt 提交给了 Bot,接着会进入生成过程:

会有一个从模糊到清晰的图像生成过程和进度显示:

完成后,系统会让你从 4 张图中选择,注意此时还没有结束,你可以从 4 张图中选择一张来 U(Upscale,放大像素并提升细节),或者 V(Variation,基于所选图片来延伸变形)。1~4 代表着左上到右下的 4 张照片。

比如点击了 V4 之后,Bot 又进入了一次新的图片生成过程:

假如你觉得第二张黑色的太阳不错,点击 U2:

然后就会生成最终的图,当然你还可以做变形、用网页打开原图,以及给出你的反馈,是惊喜还是失望,等操作。

点击 Upscale to Max,把清晰度拉满,最后生成了最终的图片。

以上就是生成图片的过程。

每个新用户会有一些免费点数,使用完后,Bot 会提示你,需要付费才能继续使用:

这部分将在后面的商业模式部分再展开。

  1. 为什么是 Discord 成就了 Midjourney?

首先,Discord 是一个共创的土壤。

Holz 说,个体的想象力是有限的,但当人们聚集在一起,想象力就会爆发。因此,Midjourney 需要创造一个社交环境,而 Discord 恰好是理想的基础设施。

在社区里,大家都在互相模仿,相当于提供了一个共创的土壤。

如果用户愿意付出额外费用脱离社区自己玩,也恰恰说明他们是特殊的商业客户。

Discord 可以实现以下功能:

  • 公告区:创始人 Holz 发布公告,邀请付费会员对新的 V4 算法产出的图片质量进行评分,发动群众,相当于系统会借鉴用户评分去调整模型的生成倾向。
  • 不同的主题频道:可以将喜好不同的付费用户分流到不同的频道内,帮助用户之间更好地形成共创。

其次,Discord 拥有广泛的用户基础。

Discord 社区运营高级经理 Mindy Day 表示,Discord 月活超过 1.5 亿。

广泛的用户认知也大幅降低了导流转化的成本。

Discord 支持多端访问,体验优秀,保证了用户的使用感受。

最后,Discord 的 Bot 机制可以帮助 Midjourney 很好地完成服务。

刚才我们已经介绍过了 Bot 机制,这里再做个简单的总结:

  1. 用户给 Bot 发送 Prompt;
  2. Bot 监测用户的付费情况(以及图片生成额度情况);
  3. 如果有限额,Midjourney 在后端直接生成图片并通过 Bot 返给用户;
  4. 如果无限额,提示用户付费。

由于 Discord 的这些因素,Midjourney 可以持续快速增长,只需要维护好 Bot 以及后端服务即可,大量降低了其他部分的工作量,可以用极少量的员工支持大规模的用户。

  1. 基于 Discord 的 Midjourney 因何爆火?

8 月底,美国科罗拉多州博览会的美术大赛公布了获奖结果,一幅名为《太空歌剧院(Théâtre D’opéra Spatial)》的作品在“数字艺术”类别中摘得了桂冠。

这幅图无论是主题、光影、人物、色彩,在专业人士眼中都算得上是上乘之作,但随后被爆料是作者使用 AI 生成的(实际上是 AI 生成后精修的),这引发了关于合法性、公平性的质疑,甚至有人将其与艺术的消亡联系起来。

这场风波背后的 AI,正是 Midjourney…… 这件事为 Midjourney 带来了海量的用户。

据报道,Midjourney 在 8 月底只有 30 万左右用户,到了 9 月底就达到了 150 万 +,说明这次美术大赛事件对其用户增长起到了巨大的推动作用。

再加上用户使用门槛极低(只需加入 Discord,输入 Prompt)、简单、效果好、超级牛逼的冷启动,使得它成功破圈。基于 Discord 建立的社区不断鼓励用户共创,增加了用户粘性,这个增长回路使得 Midjourney 不断爆发:

得益于 Discord 的社区调性、Bot 机制实现的共创效果、以及 Midjourney 生成的高质量图片抓人眼球,进而带来的用户传播自增长,这几个部分共同构成了 Midjourney 的持续增长。

如今,Midjourney 的用户总数已经突破 380 万。

当然,主动退出 Discord 的用户毕竟是少数,380 万可以算是一个累计用户数。不过,最近登录 Discord,我发现基本能看到的在线用户数都在 30 万左右,在某种程度上来说,这个用户活跃度还是很高的。

从另一个角度来看,Midjourney 和 Discord 互相成就,Midjourney 也是 Discord 上用户数量最多的服务器。

以下是与 Stable Diffusion 相关的资源信息:

  1. Stable Diffusion 安装包

随着技术的迭代,Stable Diffusion 已经能够生成非常艺术化的图片,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新的 Stable Diffusion 除了有 win 多个版本,就算说底端的显卡也能玩了哦!此外还带来了 Mac 版本,仅支持 macOS 12.3 或更高版本

  1. Stable Diffusion 视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

  1. Stable Diffusion 模型下载

stable diffusion 往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

  1. Stable Diffusion 提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

  1. SD 从 0 到落地实战演练

如果你能在 15 天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。