在 AI 图像生成领域,Google 再次出手不凡。2026 年 2 月 27 日,WIRED 报道了 Google 最新 AI 图像生成器 Nano Banana 2 的上手体验。这款模型被誉为强大的 AI 照片编辑器,能够生成逼真图像并进行精细编辑,有时甚至能"刺穿现实",创造出超现实效果。当然,正如标题所暗示的,这种颠覆并非总是完美。
Google AI 图像生成的演进之路
回顾 Google 在 AI 图像领域的布局,从早期的 Imagen 到 Gemini 集成下的图像生成功能,Google 一直紧追 OpenAI 的 DALL-E 和 Stability AI 的 Stable Diffusion。Nano Banana 2 是其最新力作,基于 Transformer 架构和扩散模型优化,参数规模据传超过 10 亿,支持多模态输入,包括文本、图像和语音提示。
行业背景中,AI 图像工具已从单纯生成转向编辑与修复。Midjourney V6 和 Adobe Firefly 等竞品强调真实性和版权安全,而 Google 则聚焦于生态集成——Nano Banana 2 将无缝嵌入 Google Photos 和 Pixel 设备,助力日常用户创作专业级照片。
亲测 Nano Banana 2:上手体验
WIRED 编辑 Reece Rogers 在测试中,首先尝试文本到图像生成。输入"一只在东京街头跳芭蕾的纳米香蕉",模型仅用 5 秒生成高清图像:香蕉身姿优雅,背景霓虹闪烁,细节如雨水反射完美无缺。这得益于其增强的物理模拟引擎,能自动修正光影和透视。
Google’s latest image model, Nano Banana 2, is a powerful AI photo editor that punctures reality. Well, sometimes.
编辑功能是亮点。上传一张家庭合照,提示"将背景换成火星景观,并让每个人穿上宇航服",Nano Banana 2 不只替换背景,还智能调整人物姿势和光线,确保一致性。相比前代,它在人脸生成上进步显著,避免了早期模型的畸形问题。
核心功能深度解析
1. 实时编辑与 inpainting:支持局部修复,如移除照片中的路人或扩展图像边界。测试中,编辑一张拥挤街景只需几秒,效果自然流畅。
2. 风格迁移与超分辨率:一键转为梵高风格,或将低清照放大 4K,无损失细节。适用于社交媒体和专业摄影。
本文由 赢政天下 独家编译 - 转载请注明来源。
3. 多模态交互:语音输入"让这张猫照更可爱",模型理解语义,添加卡通元素。
性能上,在 Pixel 9 Pro 测试机上,生成速度达 2 秒/张,功耗低,适合移动端。
优势、局限与伦理考量
Nano Banana 2 的优势显而易见:免费开源部分模型,推动生态;隐私保护强,所有处理本地化。但局限同样突出——"刺穿现实"时,偶尔生成不合逻辑图像,如香蕉长出翅膀却无阴影。幻觉问题在复杂场景更频发,准确率约 85%。
行业竞争中,它落后于 Grok 的 xAI Image 在创意自由度,但胜在稳定性和集成。伦理上,Google 引入水印机制,防范 deepfake 滥用。
编者按:AI 图像工具的下一个十年
作为 AI 科技编辑,我认为 Nano Banana 2 标志着生成式 AI 从玩具向生产力工具转型。未来,随着量子计算加持,实时视频编辑将成标配。但挑战在于平衡创新与真实:当 AI 能完美伪造现实,社会需更强监管。Google 此举或重塑摄影业,普通用户将成为创作者,专业摄影师则需转向叙事而非技术。
总体评分:8.5/10。期待正式发布,拭目以待。
(本文约 1050 字)
本文编译自 WIRED
© 2026 Winzheng.com 赢政天下 | 本文由赢政天下编译整理,转载请注明来源。原文版权归原作者所有。