谷歌开源Gemma 4:KV缓存压缩至3比特省6倍内存 综合性能仍待第三方验证
谷歌近期发布开源多模态AI模型Gemma 4,支持视频图像处理,采用Apache 2.0许可证,搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省,社区反响积极,但性能对比与落地表现仍待验证,winzheng.com Research Lab带来独家技术分析。
谷歌近期发布开源多模态AI模型Gemma 4,支持视频图像处理,采用Apache 2.0许可证,搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省,社区反响积极,但性能对比与落地表现仍待验证,winzheng.com Research Lab带来独家技术分析。
Google DeepMind据报道发布Gemma 4系列开源模型,支持文本、图像和音频多模态,可在消费级硬件如树莓派上运行。该系列包括31B和26B A4B变体,优化代理工作流和边缘计算,开发者社区反响热烈。但性能对比和实际应用待验证,此举或标志AI普及新阶段。
谷歌近日宣布推出Gemma 4,这是其开源AI模型系列一年来的首次重大更新。新一代模型在性能上显著提升,支持更广泛的应用场景,同时谷歌将许可从原有Gemini许可切换至更宽松的Apache 2.0。这标志着谷歌在开源AI领域的进一步开放,有助于开发者社区构建更强大的应用。Gemma 4延续了轻量级设计理念,适用于边缘设备和资源受限环境,与Meta的Llama和Mistral AI等竞争对手一较高下。