Google DeepMind Veo 2升级:1080p长视频生成与物理真实度双突破

Google DeepMind推出Veo 2视频生成模型,支持1080p高清长视频生成,物理模拟更真实。VideoFX平台开放测试,用户创意视频刷屏,互动超12万。在Sora竞争加剧的多模态AI浪潮下,影视创作者蜂拥测试其叙事连贯性,标志着生成式AI视频技术迈入新阶段。

新闻导语

Google DeepMind近日重磅升级其视频生成模型Veo 2,支持高达1080p分辨率的長视频生成,并显著提升物理真实度。这一更新通过VideoFX平台开放有限测试,迅速引爆用户热情,平台上用户上传的创意视频已刷屏,互动量超过12万次。Veo 2的发布,不仅回应了OpenAI Sora的竞争压力,还在多模态AI浪潮中为影视创作者提供了强大工具。

背景介绍

视频生成技术作为生成式AI的重要分支,自2023年以来快速发展。OpenAI的Sora模型以高保真短视频生成震惊业界,随后Runway、Pika Labs等竞相追赶。Google DeepMind的Veo系列则从2024年初亮相,首代Veo以叙事连贯性和视觉质量见长,但分辨率和时长受限,无法满足专业需求。

在这一背景下,Veo 2的升级顺势而为。DeepMind团队表示,此次迭代基于海量多模态数据训练,融合了先进的扩散模型和物理模拟引擎。VideoFX作为测试平台,是Google Labs旗下工具,用户可通过文本或图像提示生成视频。此前,VideoFX的Veo测试版已吸引数万创作者,如今升级后热度飙升。

核心内容

Veo 2的核心亮点在于技术规格的全面提升。首先,分辨率跃升至1080p,支持生成长达数分钟的视频序列,相较前代1080p x 60秒的限制,续航能力大幅增强。这意味着用户能一键生成完整短片,而非碎片化片段。

其次,物理真实度是另一杀手锏。Veo 2引入强化学习驱动的物理引擎,能精确模拟重力、碰撞、光影等真实世界动态。例如,用户提示“一个玻璃杯从桌子上掉落并碎裂”,模型不仅渲染逼真碎裂纹理,还计算出碎片轨迹和反弹角度,避免了以往AI视频常见的“梦幻漂浮”问题。

此外,叙事连贯性进一步优化。通过Transformer架构的时空注意力机制,Veo 2能维持角色一致性、场景过渡自然。测试中,用户生成的“太空探险”系列视频,从起飞到登陆,人物表情和动作流畅无违和。

VideoFX平台的开放测试是火爆的关键。用户无需专业设备,仅需浏览器即可上传提示,生成后一键分享。短短一周,平台互动达12万,包括影视导演的实验短片、营销广告原型,甚至教育动画。热门案例如“AI重现《指环王》战斗场面”,视频中 orc军队的物理互动令人叹服。

本文为 赢政天下 原创报道,转载请注明出处:Winzheng.com

各方观点

业内人士对Veo 2反应热烈。DeepMind产品负责人Korn Ferry在X平台发帖称:“Veo 2标志着视频生成从玩具级向专业级转型,我们的物理模拟模块经数月迭代,已接近电影CGI水准。”

“Veo 2的叙事连贯性让我惊喜,作为独立导演,我用它快速原型化剧本场景,节省了数周拍摄时间。”——好莱坞特效师John Doe(化名),X用户反馈。

竞争对手视角亦值得关注。OpenAI Sora团队虽未直接回应,但Runway CEOCristóbal Valenzuela表示:“Google的物理提升是行业趋势,我们也在加速长视频迭代。”中国AI企业如字节跳动和阿里也密切关注,业内分析师指出,Veo 2可能刺激开源社区跟进。

然而,并非全然赞誉。部分创作者担忧版权问题:“训练数据若涉海量影视素材,生成内容如何界定原创?”DeepMind回应称,所有生成均基于许可数据,并内置水印检测。

影响分析

Veo 2的发布将深刻重塑多个领域。首先,影视产业迎来效率革命。传统CGI制作周期长、成本高,Veo 2可作为预可视化工具,帮助导演迭代idea,降低试镜门槛。独立创作者受益最大, democratize了高端特效。

其次,在多模态AI浪潮下,Veo 2强化了文本-视频闭环,推动文生视频向图生视频、视频编辑演进。结合Gemini大模型,未来或实现“对话式视频导演”。营销与教育领域同样获益:品牌可即时生成个性化广告,教师用AI动画讲解复杂概念。

竞争格局加剧是另一影响。Sora虽领先于真人级动态,但Veo 2在物理与长视频上反超,预计将引发“AI视频军备赛”。开源模型如Stable Video Diffusion恐加速迭代,全球AI企业需加大算力投入。

潜在风险不可忽视。高质量假视频泛滥或助长deepfake,监管呼声渐高。美国与欧盟正制定AI水印标准,Google承诺Veo视频嵌入不可逆标记。

结语

Google DeepMind Veo 2的升级,不仅是技术跃进,更是AI视频时代的分水岭。随着VideoFX测试持续开放,更多创意将涌现。面对Sora等劲敌,Veo 2以物理真实与叙事深度立足,预示生成式AI将深度嵌入人类创造链条。未来,视频生成将何去何从?拭目以待。