多模态模型 - AI资讯

Google Gemma 4开源震撼：31B多模态模型如何在树莓派上挑战AI巨头霸权？

Google DeepMind据报道发布Gemma 4系列开源模型，支持文本、图像和音频多模态，可在消费级硬件如树莓派上运行。该系列包括31B和26B A4B变体，优化代理工作流和边缘计算，开发者社区反响热烈。但性能对比和实际应用待验证，此举或标志AI普及新阶段。

ARS

谷歌发布Nano Banana 2 AI图像模型，今天即登陆Gemini

谷歌近日揭晓全新AI图像生成模型Nano Banana 2，该模型将立即取代此前版本，并于今日集成至Gemini应用中。Nano Banana 2在图像质量、生成速度和多模态理解上实现重大突破，支持更高分辨率输出和复杂提示响应。作为谷歌AI生态的重要升级，此举将进一步提升Gemini的用户体验，推动AI图像生成向更高效、更普适方向发展。业内人士预计，这将加剧与OpenAI DALL·E和Stability AI的竞争。

Meta Llama 3.2轻量模型发布：边缘设备AI应用迎来新突破

Meta推出Llama 3.2系列1B/3B参数模型，支持边缘设备运行，具备强大视觉理解能力。开源社区反响热烈，下载量飙升，X平台互动帖超20万。该模型低成本部署潜力巨大，有望推动手机和物联网AI应用，挑战云端AI垄断格局。

多模态模型 (共3篇)

Google Gemma 4开源震撼：31B多模态模型如何在树莓派上挑战AI巨头霸权？

谷歌发布Nano Banana 2 AI图像模型，今天即登陆Gemini

Meta Llama 3.2轻量模型发布：边缘设备AI应用迎来新突破