Midjourney人物一致性难题终结?AI绘画迎来角色统一新纪元

6

Midjourney一直以来为人诟病的人物一致性问题,现在似乎有了解答方案。最近的更新在测试版本中引入了新的参数,允许用户在生成图像时更好地保持人物面部和整体风格的一致性。虽然目前还处于测试阶段,生成结果可能不稳定,但对于需要连续性角色设计的项目来说,这无疑是一个重要的里程碑。

新功能的使用方法非常简单:

  1. 在prompt后面添加“--cref 参考图链接”即可。
  2. 如果需要调整参考的强度,可以使用“--cw 0-100”。默认值为“100”,表示参考包含脸部、头发和衣服。数值“0”则只会参考人物的脸部。
  3. 使用Midjourney生成的图片作为人物参考,通常效果会更好。
  4. 可以同时使用多个人物参考,进行混合。
  5. 这个功能在Midjourney和Niji都适用,并且可以结合风格一致性同时使用。

为了更直观地展示效果,我们以大家熟悉的“神仙姐姐”为例进行演示。

1、单独人物一致性

首先,我们来测试一下基本的人物一致性。我使用以下prompt:

一个漂亮的女孩,面向镜头,微笑,白色的衣服,黑色的头发,写实,真实,细节丰富,皮肤纹理,质感,人像拍摄,照片,三点布光,光线明亮,获奖作品

然后,我们在prompt后面加上“--cref 参考图链接”。完整的prompt如下:

A beautiful girl, facing the camera, smiling, white clothes, black hair, realistic, real, rich in details, skin texture, texture, portrait shooting, photo, three-point lighting, bright light, award-winning work --cref https://s.mj.run/LI9W7hyUFuw

从结果可以看出,生成的人物和我们心目中的“神仙姐姐”还是有差距。为了测试“--cw 0-100”参数的作用,我又生成了两张图。

Prompt:

A beautiful girl, facing the camera, smiling, white clothes, black hair, realistic, real, rich in details, skin texture, texture, portrait shooting, photo, three-point lighting, bright light, award-winning work --cref https://s.mj.run/LI9W7hyUFuw --cw 50

Prompt:

A beautiful girl, facing the camera, smiling, white clothes, black hair, realistic, real, rich in details, skin texture, texture, portrait shooting, photo, three-point lighting, bright light, award-winning work --cref https://s.mj.run/LI9W7hyUFuw --cw 0

从结果来看,--cw后面的数值主要影响的是衣服,脸部并没有受到明显的影响(但仍然不像)。

既然单张参考图效果不佳,我们尝试使用两张参考图进行测试。

Prompt:

A beautiful girl, facing the camera, smiling, white clothes, black hair, realistic, real, rich in details, skin texture, texture, portrait shooting, photo, three-point lighting, bright light, award-winning work --cref https://s.mj.run/LI9W7hyUFuw https://s.mj.run/x4mPG_Id748

两个参考混合的效果不太稳定。通过分析参考图可以发现,一张是正脸,一张是侧脸,用这样的组合来生成正脸,效果不好也可以理解(特别提醒:参考的角度尽量匹配要生成的角度)。

我们尝试使用两张侧脸来生成,看看效果。

使用两张侧脸生成的图片,明显能够识别出“神仙姐姐”的样子。由此可以得出结论:如果能提供两张同角度同人的参考,就尽量提供两张

我也测试了添加三张同角度同人的参考,但得到的结果和两张参考图的结果差不多。

2、风格一致性

在测试完单独人物一致性后,我们来看看风格一致性

Prompt:

A beautiful girl, side face, smile, white clothes, black hair, realistic, real, rich in details, skin texture, texture, portrait shooting, photo, three-point lighting, bright light, award-winning work --cref https://s.mj.run/x4mPG_Id748 --sref https://s.mj.run/x4mPG_Id748 --ar 3:4

这里使用的人物和风格参考都是同一张图,效果还可以(多尝试几次,效果会更好)。同样,我也测试过多人物参考+风格参考生成图片,结果是用一张人物参考图效果最好。(建议大家多去测试,实践出真知)。

有一个奇怪的点是,我测试了很多次“垫图+iw2+人物参考+风格参考”的组合,结果出来的图和“神仙姐姐”一点关系都没有。或许这样搭配会导致混合混乱,也可能只是我运气不好。

3、Niji的人物一致性

Niji在生成动漫或漫画人物时,一致性控制得更好,这是一个令人满意的地方。

Prompt:

一个小女孩在看书 A little girl sitting on a stool reading a book --cref https://s.mj.run/EFe86I6W-K4

我没有描述任何细节,只说了“一个小女孩在看书”,就能得到这种效果,说明Niji对于非真人的人物特征把控得很好。

如果在prompt中加入小女孩的外貌描述,得到的结果会更好。

既然我们知道Niji的人物一致性控制得很好,就可以想到一个很有意思的应用场景。之前有朋友问过我,怎么用Midjourney去做儿童绘本,那么这个新功能不就是一个很好的工具吗?你看到商业机会了吗?

4、Niji绘本案例

【1】小女孩收拾行李准备出发去动物园

【2】到动物园门口了,好激动

【3】一进动物园就遇到一只傻鸟,真可爱呢

【4】居然还有鹦鹉台拍照,但我好想笑

【5】看到我脚边的熊猫了吗,它一直跟着我,我有点不安

【6】这里的动物好小只呀,还可以摸,真好

【7】这个也摸摸,真好摸,真乖

【8】不好!摸到老虎屁股了,快跑

【9】终于到家了,以后再也不去摸老虎屁股了

AIGC技术的未来展望

AIGC(Artificial Intelligence Generated Content)技术的未来发展前景非常广阔。随着人工智能技术的不断精进,AIGC技术也将迎来持续的提升。展望未来,AIGC技术将在游戏和计算领域展现出更为广泛的应用,赋能游戏和计算系统以更高效、更智能和更灵活的特性。不仅如此,AIGC技术还将与人工智能技术实现更深度的融合,从而在更广泛的领域得到应用,对于程序员群体而言,其影响至关重要。可以预见,AIGC技术将不断精进,并与人工智能技术紧密结合,从而在更多的领域开创出新的应用场景。