This article has not been translated into English yet. Showing the original Chinese version.

Google 为 Android 引入自主 AI 与氛围编码小部件

Google 在 Android 系统上推出基于 Gemini 的自主 AI 新功能,包括由 Gboard 支持的语音听写与表单填写能力,同时引入“氛围编码”小部件,用户仅需自然语言描述即可生成个性化交互组件。这标志着移动端 AI 从被动响应走向主动代理,并让编程变得更加直观和人性化。

近日,Google 在 Android 平台上发布了一系列基于 Gemini 大模型的新能力,其中最引人注目的是“自主 AI”(Agentic AI)与“氛围编码小部件”(Vibe-coded Widgets)。这两项功能不仅提升了手机日常操作的智能化水平,也预示着人机交互方式正在从“用户主动触发”转向“AI 主动代理”。

自主 AI:从辅助到代理的进化

所谓“自主 AI”,是指能够理解用户长期意图、规划多步任务并自行与环境交互的 AI 系统。与之前 Google Assistant 那样需要用户明确指令不同,Gemini Intelligence 能够主动建议下一步操作,甚至代表用户完成复杂流程。例如,当用户在地图上搜索“下午和同事一起喝咖啡”,自主 AI 可以自动查找附近咖啡馆、检查同事日程的空闲时间、发送邀请,并添加日历提醒——整个过程无需用户逐句指示。

“我们正在从‘你问,AI 答’迈向‘你说目标,AI 帮你执行’。”——Google 产品副总裁 Brian Rakowski 在内部演示中表示。

此次更新中,Gemini Intelligence 特别强化了与 Gboard 的深度整合。用户在进行语音输入时,Gboard 不仅能实时转录,还能理解上下文并主动填充表单字段。比如在填写酒店预订信息时,用户只需说“我 6 月 10 号到北京,订两间房住三天”,系统便会自动识别日期、城市、房型等关键信息,并填入对应输入框。这种“边说边填”的体验大幅降低了输入成本。

氛围编码小部件:用语言创造界面

另一个亮点是“氛围编码”(Vibe Coding)概念的落地。所谓 Vibe Coding,最早由 AI 研究员 Andrej Karpathy 提出,是指开发者仅用自然语言描述期望的功能或视觉风格,AI 即可生成代码并实时呈现结果。Google 将其延伸至 Android 主屏幕小部件:用户只需用一句话描述想要的小部件,例如“显示今天最新科技新闻的卡片,背景为星空渐变色”,Gemini 便会自动生成对应的 Jetpack Glance 代码,并作为可交互的小部件添加到桌面。

这一功能对非专业用户极具吸引力。它消除了编程门槛,让每个人都能根据自己的“氛围”或心情创造独特的桌面组件。例如,学生可以创建一个“今日待办与番茄钟组合”的小部件,上班族则可以做一个“会议倒计时+天气+心情表情”的混搭组件。Google 表示,这些由 AI 生成的小部件同样遵循 Material You 设计规范,能够自动适配用户的壁纸主题色调。

行业背景:移动 AI 的“代理化”浪潮

Google 此举并非孤例。早在 2025 年,Apple 便通过“Apple Intelligence”系统在 iPhone 上引入了类似的上下文代理功能,但仅限于部分内建 App。三星与华为也在各自的生态中尝试让 AI 控制更底层的系统能力。然而,Google 的优势在于 Android 的开放性和 Gemini 模型的强大泛化能力。通过将自主 AI 直接嵌入系统服务(通知、电话、短信)并开放给第三方开发者,Google 有望构建一个更广泛的 AI 代理生态。

与此同时,“氛围编码”概念也引发了关于“编程未来”的讨论。传统上,编程需要严谨的逻辑和语法;而 Vibe Coding 则允许用户用模糊、感性的语言表达需求,AI 负责将其转化为精确的代码。这种范式可能改变软件开发的门槛——未来,或许普通用户也能像使用自然语言交流一样“编写” App。

编者按: 自主 AI 与氛围编码的结合,本质上是将“自主性”和“创造性”同时下放给用户。但这也带来新的挑战:AI 在执行多步任务时如何保证隐私与安全?用户是否愿意让 AI 代表自己发送消息或修改系统设置?此外,AI 生成的小部件代码质量参差不齐,可能存在性能或安全漏洞。Google 必须在功能开放与风险管控之间找到平衡点。

另外值得关注的是,本次更新将在 Android 16 中首发,支持集成 Gemini 2.5 Pro 模型的设备。老机型用户则需要等待后续适配。Google 同时宣布将于下月的 Google I/O 大会上公布更多关于自主 AI 能力的开发者 API。

本文编译自TechCrunch