MJ绘画V5 VS V6 Beta – 真实与虚拟的边界正在模糊

羽夜科技
AI测评系列
2 11 月, 2024

2023年12月圣诞期间，MJ V6测试版上线了，站长我也体验了一波，感受变化最大的是图像细节方面（见下面这些图），可以看到人物效果更加真实，构图、色调、光影更加细腻🤙

图片示例

High-quality, masterpiece, masterpiece, exquisite facial features, exquisite hair face mask, exquisite eye face mask, messy hair, beautiful man, 4k picture quality, gorgeous light and shadow, Tindal effect, halo, messy hair, young, gorgeous scene, exquisite clothes, messy hair, beautiful and meticulous eyes, boy, dynamic angle, frills, beautiful hair, gorgeous, whole body, fine light and shadow, sunlight, cat ears

High-quality, masterpiece, exquisite facial features, exquisite hair face, exquisite eye, beautiful Chinese woman, 4k picture quality, gorgeous light and shadow, Tindal effect, halo, young, gorgeous scene, exquisite clothes, smooth hair, beautiful and meticulous eyes, girl, dynamic angle, frills, beautiful hair, gorgeous, whole body, fine light and shadow, sunlight

Pikachu, wearing a cool coat and a detective hat, two ears, furry toy, movie still, shiny eyes, film aesthetic, ferrania p30 –ar 3:4

影视复刻：

特别是版权影视作品，简直可以做到以假乱真的程度，以前想画出大侦探皮卡丘的电影效果，可以说是尝试了各种提示词也做不到，现在只需要加上“movie still”电影剧照这个词就能很轻松地画出电影剧照的效果。可能大侦探皮卡丘的电影剧照都没有AI画得高清哈哈哈。不仅是大侦探皮卡丘这部电影，还有漫威、DC、迪士尼等等动漫影视作品都“惨遭AI”——被MJ拿去投喂训练融入AI素材库，复刻影视人物完全没有问题，比如下面这组网上很火的“照片”：

我只想说：不能说很像，几乎就是一模一样。

再看2019年上映的电影《小丑》剧照与Midjourney V6生成图像的对比：

AI的版权问题一直面临着争议，现在V6的出现会让这个版权与抄袭的界限越来越模糊。但抛去版权问题不说，我们单纯以学习、欣赏、研究的角度来看待AI发展，还是不得不承认MJ V6的强大。

以下为Midjourney V6生成的经典动漫作品——

《火影忍者》

《瑞克和莫蒂》

《进击的巨人》

《驯龙高手》

《龙珠》

《海贼王》

《小黄人》

《蜘蛛侠：平行宇宙》

《乐高蝙蝠侠》

还有很多例子这里就不举了，以上这些图片都出自Midjourney V6，Prompt非常简单。只需一句[scene form 某某作品 –ar 16:9 –style raw]就可以实现。

甚至可以实现各种IP“梦幻联动”。比如我想要钢铁侠和蝙蝠侠同框出镜，要怎么做呢？很简单，看我的提示词：

提示词：Iron man battle Batman, Screenshot of movie

文字生成：

MJ V6不仅可以复刻著名影视作品，而且还有一定的生成文字能力！

MJ V6如何生成带有文字的图片？技巧：必须用“引号”编辑文本（比较短的文本更容易成功，比如单词与短语）

虽然现在文字生成的能力还是很初级，但是也可以有一些比较有趣的应用，我们可以来看一下新智元的图：

需要注意的是，下面这几张图像里边的单词，都是经过了3~10次“炼丹”才达到了比较理想的结果。

画出「一名男子独自站在黑暗的空旷场所，盯着写着“EMPTY”的霓虹灯招牌」。

画出「逼真的立式食品包装袋模型，装饰图里边有香蕉、葡萄干和苹果，并突出显示“ORGANIC SNACKS”的字样」。

画出「一张动漫风格的电影海报，上面写着“TOMORROW”，一个女孩仰望夜空，樱花在风中飞舞。–s 200」。

画出「一罐“Coca Cola”的广告，采用传统的夏威夷风情图案的饮料罐设计」。

画出「一个干净、简约的Logo，以冰淇淋甜筒为主题，以棕榈树为背景，并写上“ICE CREAM OASIS”的字样 –style raw」。

画出「一个干净、简约、专业设计的矢量图，描绘了在高速公路上高速行驶的摩托车骑手，并在图像上写上“FREEDOM ON WHEELS”–s 250」。

画出「一瓶香水的简约产品图，背景干净，香水瓶上写着“Floral Symphony”，周围环绕着芬芳的白花」。

画出「一张现代感的电影海报，上面写着“FALLEN”，展示了在黑暗森林中的堕落天使 –style raw –s 200」。

画一个「皮克斯动画风格的插图，一只快乐的刺猬站在一个木制招牌旁边，上面写着“SUNFLOWERS”，草地上开满了盛开的向日葵」。

测评总结

总结：MJ官方说的目前V6 Beta的更新内容：

1. 更准确的提示跟随以及更长的提示。

2. 提高连贯性和模型知识。

3. 改进的图像提示和重新混合。

4. 较小的文本绘制能力（您必须将文本写在“引号”中，并且 –style raw 或较低的 –stylize 值可能会有所帮助）

5. 改进的升级器，具有 ‘subtle ‘ 和 ‘creative ‘ 模式（分辨率提高 2 倍）

有点太废话，翻译成人话就是：能容纳更多的词语token了、语义理解更强了、图像质量更好了、能嵌入一点英文单词进去了、图像能放大更多了。下面，我们再来看看卡兹克大佬对V6的测评。

一. 图像质量的提升

图像质量我关注的是以下几个纬度：细节密度、材质质感、色彩表现、光影表现、构图表现、结构真实性。

Midjourney V6 Beta在细节密度、材质质感、光影表现、结构真实性上，都有巨幅提升。构图表现和色彩表现有小幅提升。

可以看到V6的图像质量（细节密度、材质质感、光影表现、结构真实性上）都有大幅度提升，可以说是已经分不清虚拟还是现实了，太令人震撼了。而接下来，语义理解能力的提升，才是最为重要的。

二. 语义理解的加强

我重点来聊聊语义理解这块的变化。

我曾经毫不避讳的骂过 Midjour ney，他的语义理解就是一坨屎。让我在做过往的AI作品时，无数次的带上痛苦面具想砸电脑。

但是这一次， Midjour ney V6 Beta对于语义理解的加强，终于到了中上游可用的地步，注意我用的词是“可用”。跟Dalle3这种逆天的还没发比。

首先请忘掉所有的SD式的写法，不要写tag，不要写“ photorealistic, 4k, 8k ”之类的垃圾词，他们对于新版V6 Beta没有任何蛋用。

不要写tag，不要写tag，不要写tag，重要的话我说3遍。

更别直接用v5.2的prompt直接拿来复制粘贴，请重新学习新版V6的写法。

整体上，我觉得更强调把细节说清楚的能力。我推荐的结构是：

场景+主体+细节+美学风格。

比如我的这段Prompt：

三个不同的美女朋友坐在沙滩上面向镜头微笑。中间的是一个开朗的金发白人女性，穿着短裤和红色背心。左边的朋友是一个黑发美国女孩，穿着比基尼和透明的裙子。右边的朋友是一个红发英国女孩，穿着比基尼。背景可以看到海，海上有船和飞翔的海鸥。Agfa Vista 200拍摄的中景镜头。

非常复杂，但是我几乎都是以长句子去写的，清晰的描述场景和主体以及部分衣服细节。

再看看v5.2，可以就语义理解上，做一个清晰的对比。

在新版prompt的写法上，我说一些我认为有趣的技巧：

1. 你可以指定任何细节。

不要吝啬你的想象力，更不要吝啬你的笔墨，用一切有逻辑、有结构的语言，把你想要的细节指定出来。她穿了什么衣服、衣服是什么材质、什么颜色。写明白，写明白比一切都重要。

比如：

漫威黑寡妇的半身特写镜头。黑寡妇穿着蜘蛛侠的黑色紧身衣，她的左手拿着美国队长的盾牌，右手拿着雷神之锤，她很悲伤。–ar 16:9

2. 你可以使用语言控制构图。

在V6中，现在很容易用语义去定位事物之间以及与相机的关系。这个在V5中几乎是难以想象的。

现在我们可以用短语描述一个通用的图像，以这个通用图像为焦点。围绕它填充细节。

比如：

客厅的桌子上有三个装满水果的篮子。中间的篮子里装有草莓。左边的篮子装满了橘子。右边的篮子装满了芒果。背景是一个带有圆形窗户的空白蓝绿色墙壁。

3. 你可以向你的图像中添加文本。

Dalle3的老传统了。可以给你图像添加文本，将需要嵌入图片的文字放在 “引号”内，并且保证你描述的画面上适合嵌入文本。比如你非说要在她鼻子上写个“shabi”，那写不上去你也不能怪MJ对吧。

比如：

特朗普在苹果发布会上的特写镜头。他在人群中举着一块写着“SHABI”的牌子。

三. 写在最后

Midjourney V6 Beta带来的有趣是一定的，对真实感和图像质量的加强，基本到了现在所有AI绘图的颠峰，再配上独一档的审美，以及史诗级的语义增强。

可以看到， Midjourney未来正式版V6的推出，一定又会开始“遥遥领先。”

诚然，问题还很多，比如对于其他的风格加强好像并不明显。

比如很多功能都还不支持。

但是瑕不掩瑜。

Midjourney V6 不是AI绘图的最后一步。

而是又一次AI历史长河中的丰碑。

羽夜科技

云趣AI助手：https://yquai.com/

MJ绘画V5 VS V6 Beta – 真实与虚拟的边界正在模糊

图片示例

影视复刻：

文字生成：

测评总结

一. 图像质量的提升

二. 语义理解的加强

三. 写在最后

羽夜科技

MJ绘画Niji5 VS Niji 6全面评测 – 欢迎来到“造梦”的世界

AI-3D大模型全面评测 – Tripo、Meshy、 su doA I、 CSM、LumaAI

延伸阅读:

MJ绘画V5 VS V6 Beta – 真实与虚拟的边界正在模糊

MJ绘画Niji5 VS Niji 6全面评测 – 欢迎来到“造梦”的世界

ChatGPT多模态识图评测 – GPT4视觉识图具体应用示例

Dalle3、Midjourney、Meta、Adobe四大巨头的AI绘图模型综合评测

AI-3D大模型全面评测 – Tripo、Meshy、 su doA I、 CSM、LumaAI