鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

帮我生成一个中秋节插画视频。

过去这样一个复杂指令,需要被拆分成找素材→AI生图→AI生视频多个步骤。

但现在从生图到生视频,再复杂的指令也只需一次输入就全搞定!

这就是即梦AI最新上线的Agent模式,只需要说出你的需求,它就能自动帮你写提示词,新上手的小白也能轻松玩转。

Nano banana更懂中文场景,文生图和图像编辑还比Nano banana强!

官方做出来的效果是酱紫的:

估计这时就有朋友问了,这个视频肯定制作过程很复杂吧?

NoNoNo!全程只用了一句话指令:创建12张像素风格图像并组合成视频。

又比如说可以直接批量生成一系列图像,构成完整故事。

批量生成视频也不在话下,还能直接串到一起,比如说这个人的一生:

甚至还可以直接迁移使用其他图片的风格、获取对方的提示词……

所以下面一起来康康我们的实测过程~

一手实测Agent模式

首先进入官网,点击输入框左下角的模式切换按钮,就能一键get到新上线的Agent模式。

桥豆麻袋,写提示词前,先告诉大家一个小tips

Agent现在还兼职AI小助手功能,用户可以直接询问它怎么写提示词,be like:

Prompt:请教教我如何写提示词?

好了,学会写提示词后,我们正式开始测评~

先来试试最新上线的智能多帧功能,据官方透露,Agent可以直接一口气生成多张连续图像,再自动连接首尾两帧,组成完整视频。

国庆假期将至,坐在我工位旁的小悦同学却天天在愁去哪里度假……那即梦酱先给她做份景点大全吧。

Prompt:做6张中国标志性景点的插画风图片,用智能多帧组成一份循环海报。

全程用了不到3分钟,标志性景点的插画视频就搞定了,外滩、泰山、九寨沟、张家界……应有尽有。

再看看画面美术风格呢,整体统一采用几何化风格和高饱和色彩,转场过渡也很自然。

最妙的是,它是真的很懂用户需求,原来的Prompt里并没有主动告知它要竖屏,只有关于海报的提示,结果它主动适配海报排版和移动端展示,自动生成了3:4比例的竖图,确实很贴心了。

另外悄悄告诉你,Prompt里点明用“智能多帧”,效果会更好嗷~

喜欢搞二创的劳斯们有福了,创意提升也是这次Agent模式的重点技术升级。看到喜欢的图片风格想用怎么办?Agent直接能帮忙生成类似的创意。

比如说,我想为蜜雪冰城的柠檬水打call,感觉这张化妆品广告的风格还挺适合,交给Agent模式试试。

Prompt:请帮我基于图一的风格,把图二做成广告,对应的文案也要修改。

wow!这波雪王高级感拉满。

仔细看,Agent模式生图全是细节:为了让视觉效果更纯净,也是把原图的塑料杯换成了玻璃材质;保留了可爱的Logo,但是去掉了冰淇淋权杖提升品牌档次。

一张不够,还可以生成一系列的同风格图片。

举个栗子,下面让它根据这张中秋节的海报,再多做几张让甲方挑选。

Prompt:帮我按照这张图的风格再生成四张带有“中秋佳节”字样的海报。

第一张图整体基调不变,只将字体样式改得更有阴影棱角;第二张图将楼阁改成暗色调,增加一些飘洒的花瓣特效,月饼也成了礼盒装;第三张图换成了墨绿色渐变背景,小兔子身上也加了点纹样点缀,让画面更丰富;第四张图的背景则改成了深蓝色的夜晚,月饼上还镀上了一层金属光泽,贵气!

另外,还能点击查看其中任何一张图的细节,包括对应的提示词、比例和分辨率,还能对它进行单独编辑或转成视频。

好好好,这下老板再也不用担心我的出图速度了(doge)

两张不同风格的图片,也能直接融合,比如水彩+水墨=?

Prompt:帮我混合一下这两张图。

秒哇!直接成名家画作了,既保留了第一张参考图里的瀑布、岩石等元素,也巧妙融入了第二张图的水墨意境。

色调达成了统一,以青绿色调为主,辅以黄色点缀,既有近景的写实瀑布也有远景的写意山峦,构成相当完整和谐的画面。

另外,其实Agent模式还有个隐藏大招:可以根据图片反推提示词

比如说,我在即梦官方主页的推荐作品中找到了这张图,媲美Nano Banana的手办生成效果,让我好奇用了什么提示词。

Prompt:反推这张图的提示词。

钢铁侠精致手办模型,红色金色装甲配色,站立在现代木质办公桌上,背景电脑显示器展示3D建模软件界面,屏幕显示钢铁侠角色设计,左侧放置手办包装盒,温暖室内灯光,现实主义摄影风格,产品展示效果,3:4竖版构图,专业工作环境氛围。

学会了!修修改改,我也能用即梦AI生成新手办。(即梦内心os:这一次我势必要让所有人会写提示词)

Agent模式还能直接让效率Plus,一次指令同时能生成40张图片或8个视频

还是咱们的小悦同学,直接给她安排一套全国深度游旅行照,朋友圈即梦包了。

Prompt:帮我生成吉卜力风格的全国旅游照,每张图片的主角都是一个叫小悦的女生,要和每个景点有深度互动,尤其是在上海东方明珠前要喝蜜雪冰城奶茶。

上海东方明珠、西安兵马俑、桂林漓江、成都熊猫基地、杭州西湖、青岛海滨……小悦的国庆七天乐实在太充实了!

而且在每张图中都有很好地遵循有关互动感的指令,色彩也很温暖明亮,符合吉卜力风格要求,尤其是第三张,小悦完全是千与千寻(桂林特辑)

但是生图过程中也出现了一个小bug,在北京旅游时有生成失败的情况出现。

将小悦旅行照组成一整个vlog视频,也是轻轻松松~

Prompt:帮我把图片全部串成一个视频。

整个视频都很流畅自然,镜头拍摄手法相当丰富,包括推进、俯视转平视、拉近等,每张图也都会均匀停留4秒,图和图之间过渡巧妙。

另外还有更多玩法期待大家的解锁吼~

接入Seedream 4.0模型

Agent模式和同步推出的即梦4.0版本,都是基于字节最新自研的Seedream 4.0模型

模型一经推出就强势拿下Artificial Analysis的文生图和图像编辑双榜第一,超越了谷歌的Nano Banana

相比上一代,4.0模型在逻辑理解能力和推理速度方面上显著提升,将文生图、图编辑、组图生成功能组合于一体,不同元素彼此之间可以融合成一张完整的图片,还能生成连贯的图像序列。

另外它还支持4K分辨率,这一点Nano Banana都做不到。

所以Agent模式有了它的支持,基本上可以说将AI生图降至0门槛,不会写指令,它来教;指令太复杂,它只需要一句话。

妥妥的技术福音!

现在官网还推出了为期一周的免费生图活动,赶紧体验起来吧。

官网链接:https://jimeng.jianying.com/ai-tool/home?type=agentic

参考链接:
[1]https://bytedance.larkoffice.com/docx/Qriwdcz4Sob4arxcAX6cxUMznYb
[2]https://x.com/imxiaohu/status/1967551530032345096

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —


📺 明晚20点得到APP联创和Get笔记负责人快刀青衣将做客AI 100访谈间,从Get笔记的经验与思考出发,聊聊知识领域的AI新时代。欢迎扫码预约直播!Have Fun~

一键关注 👇 点亮星标

科技前沿进展每日见

内容中包含的图片若涉及版权问题,请及时与我们联系删除