自动驾驶领域迎来了一位新玩家——AI初创公司Decart今日发布了Oasis 3,一个能够实时生成照片级逼真驾驶环境的“世界模型”。与传统的基于规则或低多边形渲染的模拟器不同,Oasis 3完全由神经网络驱动,可连续模拟数小时的高保真驾驶场景,并通过API向开发者开放。
实时生成,突破模拟瓶颈
据TechCrunch独家报道,Oasis 3的核心能力在于“实时推理”:模型能在毫秒级内对环境变化(如车辆转向、行人闯入、天气突变)做出响应,生成相应的视觉、物理和语义信息。Decart CEO在采访中表示:“过去自动驾驶公司要么使用游戏引擎构建的合成数据,要么依赖昂贵的真实路采数据。Oasis 3试图提供第三条路——一个可交互、可迭代、几乎无限的训练环境。”
该模型基于扩散变换器(Diffusion Transformer)架构,训练数据涵盖多种地理区域、交通密度和气候条件。Decart称其生成的分辨率可达4K,帧率稳定在30 FPS以上,且“一致性”优于现有开源方案(如GAIA-1或UniSim)。
“我们并非追求完美的物理碰撞检测,而是让模型学会驾驶场景中的时空连续性。比如,前车刹车灯亮起后,后车必须减速;雨滴落在挡风玻璃上的折射效果会随车速变化。” —— Decart技术白皮书
注意事项:并非“万能模拟器”
尽管Oasis 3表现出色,但Decart坦诚其存在局限性。在极暗环境(如隧道无照明)或极端天气(如暴雪、沙尘暴)下,生成的画面偶尔会出现“闪烁”或“纹理扭曲”,模型对逆光场景中交通标志的可读性也会下降。此外,长达数小时的连续模拟中,模型可能产生累积漂移,导致细微物理不一致——例如影子方向与实际光源位置错位。
行业分析师指出,这些“注意事项”实际上是当前所有生成式世界模型面临的共性难题:如何平衡“视觉真实”与“物理准确”。Waymo和Cruise等公司倾向使用基于物理引擎的模拟器(如CARLA),因为它们可保证确定性;而Oasis 3的生成式路径虽然灵活,但可解释性较弱。
API生态:降低仿真门槛
Oasis 3以API形式提供,允许开发者按需生成驾驶场景。用户可通过API参数指定道路类型(高速/城市/乡村)、交通密度、天气条件甚至特定驾驶行为(如加塞、急刹)。Decart还计划推出“场景编辑器”UI,方便非编程人员使用。
这一模式让人联想到OpenAI的Sora视频生成API——但Oasis 3聚焦于自动驾驶这一垂直场景,且支持实时交互。对于资金有限的中小型自动驾驶公司,或需要快速迭代的ADAS团队,按需生成的模拟环境可能成为性价比之选。
不过,目前API定价尚未公布。考虑到推理算力需求,其成本可能高于传统模拟器。Decart表示正在优化模型压缩技术,以降低每次模拟的Token消耗。
编者按:生成式世界模型何时“毕业”?
Oasis 3的发布是生成式AI在自动驾驶仿真领域的重要里程碑。过去,业界普遍认为“世界模型”距离实用至少还需2-3年,但Decart用实时性证明了技术演进的速度超出预期。然而,自动驾驶系统的高安全性要求意味着,任何模拟器都必须通过严格的“分布外验证”。当前Oasis 3能否捕捉到1%的事故场景(例如路上突然出现施工锥桶后方的异常物体)仍是未知数。
从更宏观的视角看,生成式模拟可能改变自动驾驶行业的数据飞轮规则:如果AI可以低成本生成几乎无限的高质量训练数据,那么“真实路采数据”的霸权地位将被削弱。但与此同时,对模拟器自身生成的“幻觉”进行对抗性训练,或许将成为新的技术壁垒。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接