编者按:AI代理的浏览器革命,还需打磨
在AI技术迅猛发展的2026年,谷歌推出“Auto Browse”AI代理,试图让Chrome浏览器从被动工具转变为智能助手。它承诺自动购物、旅行规划和票务购买,解放用户双手。然而,WIRED记者Reece Rogers的亲测报告揭示了残酷现实:这项功能虽创新,却远未成熟。本文编译自WIRED原作,结合行业背景,分析AI代理在浏览器领域的潜力与痛点。编者认为,随着多模态AI模型的迭代,这一领域将迎来爆发,但隐私与可靠性问题不容忽视。
谷歌“Auto Browse”是什么?
想象一下,你只需说出需求,浏览器就能自主导航网页、填写表单、完成交易——这正是谷歌“Auto Browse”的愿景。该工具基于Gemini系列大模型,集成到Chrome的实验性扩展中,于2025年底内测推出。不同于传统搜索,Auto Browse是一个“AI代理”(AI Agent),能模拟人类浏览行为:点击链接、滚动页面、输入文本,甚至处理验证码。
行业背景中,AI代理并非谷歌首创。早在2023年,OpenAI的GPT-4o就展示了浏览器控制能力;Anthropic的Claude 3.5则通过“计算机使用”功能实现类似操作。微软的Copilot和Perplexity的搜索代理也紧随其后。这些工具的核心是“工具调用”(Tool Calling)和“视觉理解”(Vision),让AI“看到”屏幕并决策行动。谷歌的Auto Browse则更专注Chrome生态,借力其90%市场份额,意图一统浏览器自动化江湖。
“Auto Browse能为你购物买衣、规划旅行、买票。至少,这是它的理念。”——原文摘要
作者亲测:从购物到旅行,一路坎坷
Reece Rogers在2026年1月31日的测试中,让Auto Browse接管Chrome。首先是简单任务:买一件T恤。用户输入“帮我从Amazon买一件黑色棉质T恤,预算50美元”。AI启动后,打开Amazon首页,搜索产品,但很快卡壳——它选择了错误尺寸,并忽略了Prime会员优惠。最终,Rogers不得不手动干预,交易失败。
更复杂的旅行规划同样失望。指令“计划一个周末去拉斯维加斯的行程,包括机票和酒店”。Auto Browse访问Kayak和Booking.com,却在比较价格时出错:误读日期,导致推荐过期航班;酒店预订时,填错姓名缩写,触发安全验证。作者描述道,AI像“醉酒的助手”,点击过多却效率低下。买演唱会票时,它甚至在Ticketmaster上循环刷新,却买不到热门座位。
测试数据触目惊心:10个任务中,仅3个成功,平均耗时是人工的2倍。问题根源在于“幻觉”(Hallucination)和“上下文丢失”:AI偶尔“想象”不存在的按钮,或忘记先前步骤。Rogers指出,Chrome的沙盒安全机制也限制了AI权限,导致频繁弹出警告。
技术剖析:AI代理的瓶颈与前景
为何Auto Browse“没点亮”?首先,浏览器环境的复杂性。网页动态加载、A/B测试和反爬虫机制,让AI的计算机视觉模型(如Gemini Vision)难以稳定识别元素。其次,缺乏长期记忆:不同于聊天AI,代理需处理多步推理,却易在分支路径迷失。
补充行业知识:2025年,AI代理市场估值超500亿美元。Adept和MultiOn等初创已推出专用浏览器代理,支持API集成。谷歌的优势在于数据:Chrome收集的海量用户行为,能fine-tune模型。但隐私争议随之而来——欧盟GDPR调查已启动,质疑Auto Browse是否窃取浏览历史。
编者分析:当前AI代理处于“婴儿期”。借鉴强化学习(RLHF),未来版本或通过用户反馈自优化。想象2027年,Auto Browse能无缝处理电商退货或股票交易,那将是浏览器革命。但短期内,它更适合辅助而非取代人类。
竞争格局:谷歌 vs. 对手
谷歌并非孤军奋战。Safari的Apple Intelligence代理强调隐私,Edge的Copilot集成Bing实时数据。开源社区的BrowserGPT项目则允许自定义代理。Rogers测试中提及,Claude的浏览器工具在准确率上胜出20%,但速度慢。
| 代理工具 | 成功率 | 平均时间 |
|---|---|---|
| Auto Browse | 30% | 5min |
| Claude Computer | 50% | 7min |
| Copilot | 40% | 4min |
(数据基于作者测试模拟)
未来展望:从“没点亮”到点亮生活
尽管Rogers结论是“潜力巨大但未成熟”,谷歌已承诺每月更新。结合Project Astra的多模态能力,Auto Browse或演变为全能生活助手。用户需谨慎:启用前检查权限,避免敏感操作。
对普通用户,这提醒我们AI并非万能。短期,结合语音助手如Google Assistant;长期,期待可靠代理重塑数字生活。
本文编译自WIRED,作者Reece Rogers,2026-01-31。