视频生成 (共9篇)

ARS

谷歌Vids AI大升级:Veo视频、Lyria音乐与可控AI头像

谷歌Vids视频创作工具迎来重大AI升级,集成最先进的Veo视频生成模型和Lyria音乐模型,并引入可直接指导的AI头像功能。这一更新将谷歌最强大的AI创作工具融为一体,帮助用户轻松制作专业级视频。无论企业演示、营销内容还是教育素材,Vids都能通过自然语言指令生成高质量视频、配乐和虚拟主持,提升生产力。未来,这一工具或将重塑视频内容创作格局。(128字)

谷歌Vids Veo模型 Lyria音乐
138
ARS

迪士尼叫停10亿美元OpenAI合作,Sora关闭计划成导火索

据Ars Technica报道,迪士尼突然取消与OpenAI价值10亿美元的合作项目,此举与OpenAI计划关闭Sora视频生成模型密切相关。媒体爆料称,迪士尼对此感到措手不及,且合作期间未有资金实际交易。Sora作为OpenAI的明星AI产品,曾被视为娱乐业变革利器,但安全与版权担忧或成关闭主因。此事件凸显AI科技与传统媒体巨头合作的脆弱性,可能重塑行业格局。(128字)

迪士尼 OpenAI Sora
233

SGLang-Diffusion:生产级视频生成的高级优化

继两月进展更新后,SGLang-Diffusion团队深入剖析了多项高级优化,使其成为可靠的生产级视频生成框架。这些优化聚焦可扩展性、效率与稳定性,针对扩散模型大规模部署的关键瓶颈。核心改进包括:从帧级到Token级SP-Sharding减少填充开销;Parallel Folding解耦文本编码器与DiT并行策略;分布式VAE并行编码/解码消除高分辨率内存瓶颈;修复Cache-DiT多请求稳定性问题;优化视频保存去除序列化开销;融合CuTeDSL JIT内核提升LayerNorm效率。性能测试显示,在Wan2.2 T2V任务中显著超越LightX2V。未来将继续推进2026Q1路线图。(128字)

LMSYS SGLang-Diffusion 视频生成
649
TC

AI视频独角兽Runway融资3.15亿美元,估值飙至53亿美元,剑指强大世界模型

AI视频生成初创公司Runway宣布完成3.15亿美元融资,投后估值高达53亿美元。本轮资金将用于扩展业务边界,从视频生成迈向更先进的‘世界模型’开发。这些模型能模拟真实物理世界,推动AI在视频、机器人等多领域应用。Runway此前凭借Gen-3 Alpha模型风靡影视业,此次融资彰显投资者对生成式AI的持续看好。未来,Runway或将挑战OpenAI Sora,成为世界模型赛道的领军者。(128字)

Runway AI融资 世界模型
652

SGLang Diffusion:加速视频与图像生成

SGLang Diffusion 将 SGLang 的顶尖性能扩展至扩散模型的图像和视频生成,支持主流开源模型如 Wan、Hunyuan、Qwen-Image、Qwen-Image-Edit 和 Flux。通过 OpenAI 兼容 API、CLI 和 Python 接口,提供 1.2x 至 5.9x 的加速效果。与 FastVideo 团队合作,构建从训练到生产的全生态。架构采用 ComposedPipelineBase 和高级并行技术(如 USP、CFG-parallelism),确保高效灵活。基准测试显示,在 H100/H200 GPU 上显著优于 Hugging Face Diffusers。未来将打造端到端扩散生态。(128字)

LMSYS SGLang Diffusion 扩散模型
674