当今炙手可热的文生图技术,Midjourney 绝对是绕不开的名字。它深深扎根于 Discord 社区,因此,本文将结合作者的使用体验和思考,以 Discord 为切入点,对 Midjourney 进行深入探讨。
一、 初识 Midjourney
- Midjourney 究竟是什么?
Midjourney 官方的定义是:一个独立的研究实验室,致力于探索新的思维媒介,拓展人类的想象力。他们的重点在于设计、人机交互和人工智能。目前我们所见的是其文生图产品,但未来形态可能会有更多可能性。
进入其官网,会发现一个醒目的“Join in the beta”按钮,点击后会直接跳转到 Midjourney 在 Discord 上的频道。截至目前,已有超过 380 万用户加入了该频道。
Midjourney 的大部分工作,包括最核心的图像生成,都是通过 Discord 来完成的。用户通过提交 Prompt(提示词),由 Midjourney 的 Bot 生成图像。
此外,Midjourney 还利用 Bot 机制完成其他任务,例如:
- 将用户生成的图片同步到官网的个人中心;
- 通过官网收取订阅费,并授予用户相应的使用次数。
后文将简要介绍 Discord,以便大家更好地理解 Midjourney 与 Discord 之间的共生关系。
- 创始人 David Holz
David Holz 是一位连续创业者,曾就职于 NASA 和 Max Planck 研究所,拥有流体力学博士学位。他创立了 Leap Motion 公司,后又创立 Midjourney。
Holz 对 Midjourney 的愿景是:
“Midjourney 不仅仅是想象力的引擎,更是通往未来的阶梯。面对 AI 生成的大量图像,我感到自己仿佛置身于深不见底的池塘边,明知不会游泳,却能感受到池塘的深度。
AI 就像水,人们常常将其视为洪水猛兽,这是错误的。水既有危险性,也是文明的驱动力。人类如果能学会与水共处,生活将会更加美好。
Midjourney 便是这样一股新的水源。”
- Midjourney 的未来走向?
Midjourney 正在进行许多不同的项目,致力于成为一个多元化的研究实验室,探索reflection, imagination, and coordination等主题。图像生成是目前最受关注的领域。
Midjourney 认为,其目标并非单纯的艺术创作或制造 deepfakes,而是拓展人类物种的想象力。当计算机在视觉想象力方面超越 99% 的人类时,这意味着什么?
但这并不意味着人类会停止想象。汽车比人类跑得快,但这并不意味着我们不再步行。当我们需要长距离运输大量物品时,就需要引擎,无论是飞机、轮船还是汽车。
Midjourney 希望将这项技术打造为想象力的引擎,它将是一件积极且以人为本的事情。
二、 Discord 成就 Midjourney
创始人 David Holz 曾表示,很多人问他们为什么不做一款 iOS App 来生成图片?因为人们希望共同创造,而在 iOS 上实现这一点,就必须建立自己的社交网络,这非常困难。Discord 在这方面做得很好,它是一个非常棒的实现介质。
这种选择帮助 Midjourney 实现了快速增长。在深入探讨之前,我们先来了解一下 Discord。
- Discord 是什么?
Discord 于 2015 年上线,最初专注于游戏语音连麦。它基于 Voip 技术,具有多端支持(特别是网页端)、免费、上手门槛低、语音清晰、延时低、连接稳定等特点,逐渐获得了用户的认可。
疫情之后,Discord 的社区功能开始崭露头角,突破了游戏领域。例如,它成为了欧洲许多高校的线上教学工具。
Discord 本质上是一个社区,语音只是其主打功能之一。
Discord 的两位创始人表示:“Discord 与大多数在线社交工具完全不同,它没有游戏化系统,没有追随者人数,没有算法推荐。它只是创造了一个地方,让你感觉就像你的朋友就在身边,你遇到他们并与他们交谈、闲聊。”
用户可以非常便捷地创建服务器,并在服务器上设立不同的频道,可以理解为频道是不同的主题房间。
另一个关键点是,Discord 拥有 Bot 机制,你可以将其理解为机器人或插件,允许第三方在 Discord 提供的接口下进行独立开发。
这极大地扩展了社区的功能,增加了用户的粘性,并且支持开放邀请 Bot 加入频道的功能(Midjourney 也支持了邀请功能)。
Midjourney 通过在 Discord 上创建了自己的服务器,并创建了大量的频道,以及开发了自己的机器人,来向用户提供服务。
- 如何在 Discord 中使用 Midjourney?
我们来简单分享一下如何在 Discord 中使用 Midjourney,方便一些无法访问的朋友更好地理解:
首先需要注册一个 Discord 账号,然后进入新手的 newbie 频道就可以快速生成图片:
在 newbie 频道中,“/” 可以调出所有的命令:
当你输入 /imagine + 提示词,再回车后,就相当于把 Prompt 提交给了 Bot,接着会进入生成过程:
会有一个从模糊到清晰的图像生成过程和进度显示:
完成后,系统会让你从 4 张图中选择,注意此时还没有结束,你可以从 4 张图中选择一张来 U(Upscale,放大像素并提升细节),或者 V(Variation,基于所选图片来延伸变形)。1~4 代表着左上到右下的 4 张照片。
比如点击了 V4 之后,Bot 又进入了一次新的图片生成过程:
假如你觉得第二张黑色的太阳不错,点击 U2:
然后就会生成最终的图,当然你还可以做变形、用网页打开原图,以及给出你的反馈,是惊喜还是失望,等操作。
点击 Upscale to Max,把清晰度拉满,最后生成了最终的图片。
以上就是生成图片的过程。
每个新用户会有一些免费点数,使用完后,Bot 会提示你,需要付费才能继续使用:
这部分将在后面的商业模式部分再展开。
- 为什么是 Discord 成就了 Midjourney?
首先,Discord 是一个共创的土壤。
Holz 说,个体的想象力是有限的,但当人们聚集在一起,想象力就会爆发。因此,Midjourney 需要创造一个社交环境,而 Discord 恰好是理想的基础设施。
在社区里,大家都在互相模仿,相当于提供了一个共创的土壤。
如果用户愿意付出额外费用脱离社区自己玩,也恰恰说明他们是特殊的商业客户。
Discord 可以实现以下功能:
- 公告区:创始人 Holz 发布公告,邀请付费会员对新的 V4 算法产出的图片质量进行评分,发动群众,相当于系统会借鉴用户评分去调整模型的生成倾向。
- 不同的主题频道:可以将喜好不同的付费用户分流到不同的频道内,帮助用户之间更好地形成共创。
其次,Discord 拥有广泛的用户基础。
Discord 社区运营高级经理 Mindy Day 表示,Discord 月活超过 1.5 亿。
广泛的用户认知也大幅降低了导流转化的成本。
Discord 支持多端访问,体验优秀,保证了用户的使用感受。
最后,Discord 的 Bot 机制可以帮助 Midjourney 很好地完成服务。
刚才我们已经介绍过了 Bot 机制,这里再做个简单的总结:
- 用户给 Bot 发送 Prompt;
- Bot 监测用户的付费情况(以及图片生成额度情况);
- 如果有限额,Midjourney 在后端直接生成图片并通过 Bot 返给用户;
- 如果无限额,提示用户付费。
由于 Discord 的这些因素,Midjourney 可以持续快速增长,只需要维护好 Bot 以及后端服务即可,大量降低了其他部分的工作量,可以用极少量的员工支持大规模的用户。
- 基于 Discord 的 Midjourney 因何爆火?
8 月底,美国科罗拉多州博览会的美术大赛公布了获奖结果,一幅名为《太空歌剧院(Théâtre D’opéra Spatial)》的作品在“数字艺术”类别中摘得了桂冠。
这幅图无论是主题、光影、人物、色彩,在专业人士眼中都算得上是上乘之作,但随后被爆料是作者使用 AI 生成的(实际上是 AI 生成后精修的),这引发了关于合法性、公平性的质疑,甚至有人将其与艺术的消亡联系起来。
这场风波背后的 AI,正是 Midjourney…… 这件事为 Midjourney 带来了海量的用户。
据报道,Midjourney 在 8 月底只有 30 万左右用户,到了 9 月底就达到了 150 万 +,说明这次美术大赛事件对其用户增长起到了巨大的推动作用。
再加上用户使用门槛极低(只需加入 Discord,输入 Prompt)、简单、效果好、超级牛逼的冷启动,使得它成功破圈。基于 Discord 建立的社区不断鼓励用户共创,增加了用户粘性,这个增长回路使得 Midjourney 不断爆发:
得益于 Discord 的社区调性、Bot 机制实现的共创效果、以及 Midjourney 生成的高质量图片抓人眼球,进而带来的用户传播自增长,这几个部分共同构成了 Midjourney 的持续增长。
如今,Midjourney 的用户总数已经突破 380 万。
当然,主动退出 Discord 的用户毕竟是少数,380 万可以算是一个累计用户数。不过,最近登录 Discord,我发现基本能看到的在线用户数都在 30 万左右,在某种程度上来说,这个用户活跃度还是很高的。
从另一个角度来看,Midjourney 和 Discord 互相成就,Midjourney 也是 Discord 上用户数量最多的服务器。
以下是与 Stable Diffusion 相关的资源信息:
- Stable Diffusion 安装包
随着技术的迭代,Stable Diffusion 已经能够生成非常艺术化的图片,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。
最新的 Stable Diffusion 除了有 win 多个版本,就算说底端的显卡也能玩了哦!此外还带来了 Mac 版本,仅支持 macOS 12.3 或更高版本。
- Stable Diffusion 视频合集
我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。
- Stable Diffusion 模型下载
stable diffusion 往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。
- Stable Diffusion 提示词
提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。
- SD 从 0 到落地实战演练
如果你能在 15 天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。