谷歌开源Gemma 4:KV缓存压缩至3比特省6倍内存 综合性能仍待第三方验证
谷歌近期发布开源多模态AI模型Gemma 4,支持视频图像处理,采用Apache 2.0许可证,搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省,社区反响积极,但性能对比与落地表现仍待验证,winzheng.com Research Lab带来独家技术分析。
谷歌近期发布开源多模态AI模型Gemma 4,支持视频图像处理,采用Apache 2.0许可证,搭载TurboQuant技术可将KV缓存压缩至3比特实现6倍内存节省,社区反响积极,但性能对比与落地表现仍待验证,winzheng.com Research Lab带来独家技术分析。