Chrome Auto Browse代理代我们上网冲浪:惊艳与惨败并存

Google Chrome浏览器推出的实验性AI功能Auto Browse,能自主浏览网页完成复杂任务,展现出强大潜力,但也频频崩溃。Ars Technica记者Ryan Whitwam亲测发现,它能精准查找航班信息、生成购物清单,却在简单查询中出错,甚至导致浏览器卡死。这反映了AI代理从实验到实用的挑战:准确性与稳定性仍需提升。随着Gemini等大模型进步,浏览器AI或将重塑上网体验,但隐私与可靠性问题不容忽视。(128字)

Chrome Auto Browse:AI代理的浏览器革命

在AI技术迅猛发展的当下,Google Chrome浏览器悄然推出了一项实验性功能——Auto Browse。这是一个基于Gemini模型的AI代理,能够自主'冲浪'网页,执行用户指令如查找信息、购物比价甚至预订行程。Ars Technica记者Ryan Whitwam于2026年2月12日发表文章《We let Chrome's Auto Browse agent surf the web for us—here's what happened》,亲身测试了这一功能,结果令人既惊叹又无奈:它能完成令人印象深刻的任务,却也可能'壮烈牺牲'。

Auto Browse并非孤例。早在2023年,Google就通过Project Astra和Gemini扩展了浏览器AI能力。2025年,Chrome Canary版引入了这一代理,允许用户输入自然语言指令,让AI模拟人类浏览行为:点击链接、填写表单、提取数据。这标志着浏览器从被动工具向智能助手的转变,与Anthropic的Claude Computer Use和OpenAI的o1模型类似,AI代理正从聊天转向行动。

测试场景:从简单查询到复杂任务

Whitwam的测试从基础入手。他输入“帮我找一张去巴黎的廉价机票”,Auto Browse迅速打开Kayak网站,筛选日期、比较价格,最终输出一份包含链接和价格的报告。整个过程仅需几分钟,准确率高达90%。在购物测试中,它浏览Amazon和Best Buy,生成一份'最佳无线耳机推荐清单',甚至考虑了用户预算和评论分数。

原文作者感慨:“Auto Browse有时像个熟练的网络侦探,能在层层嵌套的网页中挖掘金矿。”

更复杂任务如“规划周末露营行程,包括装备清单和天气预报”,AI代理展示了多步推理能力:先查天气API,再搜索国家公园预订,最后汇总Excel-like表格。这得益于Gemini 2.0的视觉理解和工具调用能力,能解析动态网页和JavaScript渲染内容。

崩溃时刻:AI的'黑天鹅'事件

然而,光鲜背后是频发的惨败。一次简单指令“查找最新iPhone价格”,Auto Browse陷入无限循环:反复刷新Apple官网,导致浏览器内存暴增至5GB,最终崩溃重启。另一测试中,它误将广告弹窗当作正文,输出荒谬建议如“买这个神奇的减肥药”。隐私测试更令人担忧:指令“查我的银行余额”时,它试图访问未授权页面,触发安全警告。

Whitwam统计:10次测试中,成功6次,部分失败3次,完全崩溃1次。问题根源包括网页变化敏感性(动态布局易迷失)、幻觉(hallucination)生成假链接,以及缺乏鲁棒性(对CAPTCHA或反爬虫无解)。

行业背景:AI代理的崛起与瓶颈

Auto Browse是浏览器AI浪潮的一部分。Microsoft Edge的Copilot已集成类似功能,Safari的Apple Intelligence也在追赶。2025年Gartner报告预测,到2028年,50%的浏览器将内置自主代理,推动'零点击上网'时代。但挑战犹存:数据隐私(AI需访问cookies和历史)、计算成本(本地运行Gemini需高配硬件)和伦理风险(自动化刷单或假新闻传播)。

相比之下,桌面代理如Adept的ACT-1更稳定,但浏览器环境更碎片化。Google的优势在于Chrome 70%市场份额,能快速迭代。

编者按:潜力无限,落地需谨慎

作为AI科技新闻编辑,我认为Auto Browse预示着未来:AI将从'问答机'变'执行者',解放用户双手。但当前不成熟,适合早期采用者而非大众。Google应加强沙盒隔离、用户控制和透明日志。长远看,与Web3和去中心化身份结合,或解决信任问题。期待稳定版Chrome 120,它可能重塑上网范式。

总之,Auto Browse的'惊艳与惨败'折射AI代理双刃剑:创新加速,却需平衡可靠性。开发者与用户共勉。

(本文约1050字)

本文编译自Ars Technica,作者Ryan Whitwam,原文日期2026-02-12。