实测全球爆火的Veo3,体验如何?

【来源:虎嗅网】

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《AI 视频新王全球爆火,威尔·斯密斯终于可以好好吃面(附大量实测演示)》,题图来自:Veo3生成

上一代寂寂无名,这一代全球爆火——说的就是 Veo3。

这周过去的 Google I/O 大会,带来的最惊艳的更新,莫过于 Veo3。上一个版本,也就是 Veo2 出来时,正好是 OpenAI 用生图魔法咔咔乱杀的时候,Veo2 就这么被遗忘在角落。

这一次在谷歌以 Gemini 为主角进行全系大升级的情况下,Veo3 终于扬眉吐气了一把。它的强大也毋庸置疑,金标准就是“史密斯吃面条”。

史密斯不再是手指乱飞、五官狰狞的样子,而是慢条斯理地吸溜意大利面。从拿起叉子,到送入口中,整个过程流畅丝滑。食物的物理特性表现得也很好,意大利面的缠绕和拉伸效果很写实。

而 Veo3 本次的更新最大的亮点,在于可以同步生成符合视频内容的音效。史密斯“吸溜”面条的声音,跟画面完全一致。

Veo3 作为视频生成模型,搭载于 Google 全新推出的整合型视频平台 Flow 和 Whisk。目前对美区用户开放,需要订阅 Google AI Ultra,价格为每季度 124.99 美元。

毫不费力,实现音画同步

看看这个水波纹的动态效果,渲染得非常真实细腻,水面反射的效果也很自然。纸船在水面上的漂浮状态、随着水流的波动轻微晃动,符合实际物理规律。

尤其是最后镜头切换到排水口时,水流的湍急程度和漩涡的形成,以及水花的飞溅都被表现得极为生动和真实。

这种复杂的流体动力学效果通常需要高精度的物理模拟。更重要的是,所有的声音也完全按照纸船的运动轨迹,毫不出戏。

生成式视频的物理逻辑问题,无限趋近于解决,除了不够稳定之外。除了纸船流水,这支视频里的奶茶还在锅中时,液体细节比如气泡、流动等,表现得非常细腻。

从锅中液体到倒入杯子的过程中,泡沫的形成和扩散也很自然。这种细腻的表现力是 Veo3 无比强大的地方。

特殊画幅也不在话下。像这个鱼眼镜头,同时又保持了货架上的商品细节,以及人物动作的连贯。伸手拿取商品、观察货架等动作,都毫无瑕疵。

甚至,这个仿监控摄像的画面还带有时间戳,相当有迷惑性。

AI 生成的魅力在于能够组合各种意想不到的元素,比如这个应用了老式录像带的画风,却是一个蜥蜴人/恐龙人(?)作为主角。

虽然有点诡异,但恐龙角色的动作细节毫不马虎,例如握持吉他时的手部姿势和弹奏动作,以及手持饮料罐时的细节处理,都很到位。恐龙的外形同样栩栩如生,皮肤纹理、眼睛的动态效果以及整体的表情变化都非常灵动。

还有一个切开毛毡奇异果的视频,羊毛球柔软、蓬松的质感,表面的纤维纹理和刀刃的反光都处理得非常好,剖面展示出来那一刻相当流畅。

配套的音效,完全不是常规水果的声音,而是硬羊毛和金属摩擦的声音——太准确了。

Veo3 的声音生成包括非语言类的元素,以及语言类的台词、旁白,同时支持非英语的旁白生成。

像这支视频里,青蛙的表情和动作变化非常连贯,从眼神的转动到嘴巴的微动,都跟台词保持高度同步。

这个角色是青蛙,它不仅在外形上高度拟真,皮肤质感、眼睛的动态效果以及表情的变化都非常写实。尤其是爪子紧握吧台边缘,甚至能让人感觉到重量感和摩擦力。

画面能跟音乐结合吗?安排。这支视频里,Rap 与动作的高度同步,节奏和强度与人物的动作完美结合,使整个场景充满了活力和动感。镜面反射的效果不仅增加了视觉上的复杂性,还使得动作显得更加立体和富有层次感。

仔细看,人物的动作非常连贯,从一个动作到下一个动作的过渡自然,显示出高水平的动画控制能力。

最让人震撼的是一个车展的视频,背景中的汽车展示区、展位标识以及人群活动都几乎毫无瑕疵——盯着看了老半天,也没看出什么错处来。连展台设计和摆放位置跟三次元的车展,不说是一模一样,简直是毫无区别。主持人在介绍时的手势引导,与他人互动时的身体语言,包括专业的语调专业和感染力都无可挑剔。

这么复杂的画面,大量的人像,而且是运动人像,复杂的音效,Veo3 全都 hold 住了,这是非常震撼的一个用例。

车展这个视频已经非常完备了,还有没有更完备的?

Veo3 很认得清自己的位置:创意工具。所有的 AI 生成工具都是这样,应该为了实现创意而服务,而非喧宾夺主。所以有网友通过 Veo3,打造了一条“打破第四堵墙”的 AI 控诉视频。

这才是《黑镜》该有的样子。

目测有一定拼接剪辑工作,但不妨碍展示 Veo3 在电影风格方面的实力。

人物的表情和动作非常逼真,尤其是情绪激动时的细节处理。环境和背景的设计也体现了 AI 的强大能力,例如废墟街道的破败景象和医院的安静氛围,都表现出高度的还原。

每个场景都通过细腻的表情、动作和环境设计,实现了多层次的情感表达和氛围渲染,虽然台词是讽刺,但品质上来看,可以说是接近电影级的出品。

One More Thing

Veo3 的爆火也迅速吸引了浑水摸鱼的乐子人,拿着明明是真人视频,假装炸裂地高呼:天呐!AI 都这样了可怎么办呐!

比如用电影段落来混淆视听的,像《头号玩家》,视觉效果拉满的段落,人很难记得细节,只能记得一些感受。偷来搞乐子,确实很容易让人中招。

而在人物方面,扎克伯格是最容易中枪的——不是因为别的,而是因为他本人“伪人感”也太重了。

无论是表情,还是肢体语言,仿佛刚刚驯服四肢……

小扎,被当作 AI 样片挂出来,要反思一下是谁的问题啊!

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO

本站部分内容来源于网络,如果你是该内容的作者,并且不希望本站发布你的内容,请与我们联系,我们将尽快处理!

首个再生金属品种将上市!铸造铝合金期货和期权来了