即梦3.0 来了!

前几天我们还在为了 GPT-4o 强大的生成中文能力狂欢,现在,即梦3.0 又又又顶破了中文生成的天花板!

你们这 AI 生图的天花板是怎么了?疯狂卷出新高度是吧。

虽然但是,我们还是玩到停不下来!先放几张我觉得特别牛的例子:

这个中文能力稳定到基本上一两次就能抽出想要的准确文字和排版,而且对比之前的即梦2.1,画质和审美也有了非常显著的提升。

所以我和阿汤一拍即合,直接给大家上个大强度:

  • 对比 即梦3.0、GPT-4o、即梦2.1 的中文生成能力

  • 对比 即梦3.0 和 即梦2.1 的审美和画质

前方超多图预警!Here we go!

(以下部分案例由 @卡兹克、@歸藏 提供,感谢大佬们!案例太多,完整原图和提示语打包了,点击「阅读原文」即可)


Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~
图片
进群之后,你有机会得到:
  • 高浓度的主流模型(如 DeepSeek 等)开发交流;

  • 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

  • 好用、有趣的产品/案例,Founder Park 会主动做宣传。



01 

多样化艺术字 

先说结论,测试到目前为止,有很明显的感觉是即梦 3.0的中文能力整体上超过GPT-4o。但是在有推理剧情的小漫画上,GPT-4o有本身的语言模型的优势,整个的逻辑能力是更强的。下面,我们分成艺术字产品海报电商海报活动海报剧情漫画进行详细的对比。

1. 艺术字

首先最大的感受是,即梦3.0对于字体的设计非常多样,而且设计出来的字体特效感很强。这一点是目前 GPT-4o 只通过文字提示语做不到的,绝大多数情况还是需要把我们想要的字体样式图片发送给 4o 辅助它生成:

把 2.1、3.0 和 4o 这样放在一起对比就很明显了,即梦3.0 做的每一张细节都很足,对于“冰块”“糖果的胶状感”“雕刻金属感”,3.0都做到了极致。

2. 产品海报

实际上,当中文能够比较稳定的被 AI 生成后,有很多人都在说可以用来做自家产品海报。但放在从前,即梦2.1的图片还没有那么清晰,中文还总是带着一些乱码小字,导致不能够投入真正的生产中,但很明显这层壁现在被3.0打破了:

我不得不说,3.0洗衣液这个图真的有唬到我,从文字到产品再到一些周围的元素展示,整体上都很接近真实的产品宣传图了。虽然最终是否能够投入到实际的产出中还要另说,因为毕竟设计到商业产品,需要产品细节展示的非常精准,但作为一个排版灵感提示和初期 demo 是完全可以的程度。

3. 电商海报

电商这个品类,即梦2.1的时候就已经有雏形了。因为我们浓厚的电商大环境,所以训练素材非常丰厚。3.0做出来的很多图,我真的是觉得可以拿出来直接用的程度。

直接上三组大促图:

就3.0这个整体质感,不仅能够稳定输出大标题文字,而且周围元素搭配的都很准确,一些小 logo 比如那些礼品盒购物车啊啥的做的都很准确,不再是之前2.1经常会有模糊或者融成色块的感觉。说实话,我觉得一些小成本商铺之后直接拿来大促用都完全够用,这真的大大降本。

4. 活动海报

这个类型是我觉得进步最最最最最最大的一 part !直接是从不太能用实现了到接近真实生产效果的一大步跨越!大家直接看图就能明白我的意思了:

即梦3.0这几张图给我惊麻了!这几张进步太明显了,我感觉我在生活中好像真的看到过这样的海报。尤其是义卖会拿张图,场景、细节都太真实了,真实到我感觉它小的时候抱过我。

5. 剧情漫画

上次我们盘 4o 的时候,就说过它做漫画很强,更别说这几天铺天盖地火爆的用4o出各风格小漫画的教程了。当时,我们还捞即梦2.1出来公开处刑了一下。但没想到这才过了几天,即梦3.0就直接迎头赶上了:

说实话,需要自己推理剧情或者给到非常长提示文本的四格漫画还是 4o 的逻辑性更强一点。单张漫画图片的效果即梦3.0的效果已经可以直接追平 4o 了。就是也期待3.0也能赶快支持多张图上传辅助固定风格。

除此之外,我们还把前几天即梦2.1的图片又拿给 3.0 重新跑了一遍:

实际上,体验到现在,我可以很明确的说,生成带有中文字的图片首选即梦3.0肯定没错;如果需要模型自行推理并生成,可以使用4o。

但是随着 4o 生图开始给免费用户开放生图后,紧张的生图资源和超慢的 roll 图速度,还有时不时的直接卡住生图,确实让人恼火的很。


02 

画质与审美 

在 4o 出来之前,即梦2.1基本上已经覆盖了我80%以上的生图需求。Midjourney 越来越不听话,V7 又不知道啥时候出来;FLUX 大多数都用来做漂亮小姐姐的写实照片;一些 lora 模型又不太适合大批量图片的产出。只有即梦2.1是综合能力最好的,但唯一的问题就是那个画质差了点,中文有时候会乱码,画面上有时候总是会出来点莫名的不太需要的元素。但这些在即梦3.0上,好像都不是问题了。

同样的我们也是分为影视级质感时尚摄影本地化审美,和大家一起来看看即梦3.0对比2.1都做出了哪些升级。

1. 影视级质感

即梦3.0上线了2k画质,不仅整体上画面质感提升了一个 level,整体审美上也有非常大的提高,就能很明显的感觉到现在的图片更高级了。

我们也拿非常多的图片对比一下2.1和3.0的区别,让大家一次性看个够。

3.0的 2k 画质就是强,而且2.1的即梦其实画面细节丢失的还蛮多的,之前的图片的颜色总是会有一点点糙的感觉。但现在的3.0把图片颜色处理的更加细腻了,细节也更精准,图片上少了很多无意义的线条和色块,图片看起来更精致了。

2. 时尚摄影

这一块我想单独拎出来说,也是因为有这两张我很惊艳的图:

直接幻视杂志封面了有没有,高级感要溢出屏幕了。如果说之前的即梦2.1是个刚拿起相机的实习生,现在至少要进步到独立工作室的程度了。期待支持一个垫图换脸,我也想给自己也来一组杂志大片。

3. 本地化审美

果然啊,咱们自己的东西就得是咱自己的国产大模型生成。先不说之前的2.1就本土味儿就已经做的很好了,这升级之后确定不是谁在街上扫街拍到的吗?而且一些中国元素的展示,包括像京剧戏服、庭院细节、甚至是整个宫殿的构图和宫人的风格,都更贴了。

到这里,我只能说即梦3.0给我带来的惊喜是一波又一波。感觉我自己的 AI 作图工作流又可以进一步优化了。每一次有这样的感受,我都非常开心,因为确实能够感知到我们在进步,创作者也在随之进步,这样未来流向市场的也将是越来越优质的东西。

但我也想说,我们完全可以根据自己的需求选择使用的工具,一个新工具的出现不代表着我们要抛弃另一个工具,组合搭配,才能实现超级增效。


03 

写在最后 

这才4月刚开了个头,

AI生成影像的天就翻了又翻。

GPT-4o、Gemini 火了;

新来的 Runway Gen4 图生视频拉了,多参生成是个期货,遥遥无期;

就在这个意料的意料之外,毫无征兆的等来了这个大惊喜:

即梦3.0。

即刻造梦,梦想成真,

在这一刻又一次具象化了。

2025 对于设计师来说可能是有点噩梦吧,

但我有不同的想法,有着专业知识的设计师们使用AI的时候能站在巨人的肩膀上,

没错,你的专业就是最强大的后盾,是别人无论如何都夺不走的东西。

就像当年从手工绘图进化到拿起第一块数位板的那个时刻,

那在如今更新技术来临的时候,

又何尝不能加入呢?

@ 作者 / 阿汤 & 卡尔@ 动手学AI知识库 / learnprompt.pro


图片

更多阅读
宇树科技王兴兴的早期故事:还原天使轮投资人当年的坚定、纠结与今天的新期望
a16z:语音交互会成为AI应用公司最强大的突破口之一,巨头们已落后太多
AI医疗独角兽OpenEvidence:1/4的美国医生都在用,像互联网产品一样做AI医疗
AppStore首页推荐后,依然月入不足3000,独立开发两年血泪复盘

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除