Google Gemma 4开源震撼:31B多模态模型如何在树莓派上挑战AI巨头霸权?
Google DeepMind据报道发布Gemma 4系列开源模型,支持文本、图像和音频多模态,可在消费级硬件如树莓派上运行。该系列包括31B和26B A4B变体,优化代理工作流和边缘计算,开发者社区反响热烈。但性能对比和实际应用待验证,此举或标志AI普及新阶段。
Google DeepMind据报道发布Gemma 4系列开源模型,支持文本、图像和音频多模态,可在消费级硬件如树莓派上运行。该系列包括31B和26B A4B变体,优化代理工作流和边缘计算,开发者社区反响热烈。但性能对比和实际应用待验证,此举或标志AI普及新阶段。
谷歌近日揭晓全新AI图像生成模型Nano Banana 2,该模型将立即取代此前版本,并于今日集成至Gemini应用中。Nano Banana 2在图像质量、生成速度和多模态理解上实现重大突破,支持更高分辨率输出和复杂提示响应。作为谷歌AI生态的重要升级,此举将进一步提升Gemini的用户体验,推动AI图像生成向更高效、更普适方向发展。业内人士预计,这将加剧与OpenAI DALL·E和Stability AI的竞争。
Meta推出Llama 3.2系列1B/3B参数模型,支持边缘设备运行,具备强大视觉理解能力。开源社区反响热烈,下载量飙升,X平台互动帖超20万。该模型低成本部署潜力巨大,有望推动手机和物联网AI应用,挑战云端AI垄断格局。