Chrome Auto Browse:AIエージェントによるブラウザ革命
AI技術が急速に発展する現在、Google Chromeブラウザは実験的機能「Auto Browse」を静かにリリースした。これはGeminiモデルに基づくAIエージェントで、自律的にウェブページを「サーフィン」し、情報検索、価格比較、さらには旅程予約などのユーザー指示を実行できる。Ars Technicaの記者Ryan Whitwamは2026年2月12日に記事「We let Chrome's Auto Browse agent surf the web for us—here's what happened」を発表し、この機能を自ら体験した。結果は驚嘆と無力感の両方を感じさせるものだった:印象的なタスクを完成できる一方で、「壮烈な失敗」を起こす可能性もある。
Auto Browseは孤立した例ではない。早くも2023年、GoogleはProject AstraとGeminiを通じてブラウザのAI機能を拡張していた。2025年、Chrome Canary版はこのエージェントを導入し、ユーザーが自然言語で指示を入力すると、AIが人間のブラウジング行動を模倣できるようになった:リンクのクリック、フォームの入力、データの抽出。これはブラウザが受動的なツールから知能アシスタントへの転換を示しており、AnthropicのClaude Computer UseやOpenAIのo1モデルと同様に、AIエージェントはチャットから行動へと移行している。
テストシナリオ:簡単な検索から複雑なタスクまで
Whitwamのテストは基本から始まった。彼は「パリへの格安航空券を探して」と入力すると、Auto Browseは迅速にKayakウェブサイトを開き、日付を選別し、価格を比較し、最終的にリンクと価格を含むレポートを出力した。全プロセスはわずか数分で、精度は90%に達した。ショッピングテストでは、AmazonとBest Buyを閲覧し、「最高のワイヤレスイヤホン推奨リスト」を生成し、ユーザーの予算とレビュースコアまで考慮した。
原著者は感嘆した:「Auto Browseは時に熟練したネット探偵のようで、何層にも入れ子になったウェブページから金鉱を掘り出すことができる。」
「週末のキャンプ旅行を計画し、装備リストと天気予報を含める」などのより複雑なタスクでは、AIエージェントは多段階推論能力を示した:まず天気APIを確認し、次に国立公園の予約を検索し、最後にExcelのような表にまとめた。これはGemini 2.0の視覚理解とツール呼び出し能力のおかげで、動的ウェブページとJavaScriptレンダリングコンテンツを解析できる。
クラッシュの瞬間:AIの「ブラックスワン」イベント
しかし、輝かしい成果の背後には頻発する惨敗があった。「最新のiPhone価格を調べて」という簡単な指示で、Auto Browseは無限ループに陥った:Apple公式サイトを繰り返し更新し、ブラウザのメモリが5GBまで急増し、最終的にクラッシュして再起動した。別のテストでは、広告ポップアップを本文と誤認し、「この魔法のダイエット薬を買え」などの荒唐無稽な提案を出力した。プライバシーテストはさらに懸念すべきものだった:「私の銀行残高を確認して」という指示で、未承認のページにアクセスしようとし、セキュリティ警告を引き起こした。
Whitwamの統計:10回のテストで、成功6回、部分的失敗3回、完全クラッシュ1回。問題の根源には、ウェブページの変化への感受性(動的レイアウトで迷いやすい)、幻覚(hallucination)による偽リンクの生成、堅牢性の欠如(CAPTCHAやアンチクローリングに対して無力)が含まれる。
業界背景:AIエージェントの台頭とボトルネック
Auto Browseはブラウザ AI波の一部である。Microsoft EdgeのCopilotはすでに類似機能を統合し、SafariのApple Intelligenceも追いかけている。2025年のGartnerレポートは、2028年までに50%のブラウザが自律エージェントを内蔵し、「ゼロクリックインターネット」時代を推進すると予測している。しかし課題は依然として存在する:データプライバシー(AIはクッキーと履歴にアクセスする必要がある)、計算コスト(Geminiをローカルで実行するには高スペックハードウェアが必要)、倫理的リスク(自動化による不正購入やフェイクニュース拡散)。
対照的に、AdeptのACT-1のようなデスクトップエージェントはより安定しているが、ブラウザ環境はより断片化している。Googleの優位性はChrome 70%の市場シェアにあり、迅速に反復できる。
編集者注:無限の可能性、実装には慎重さが必要
AI科技ニュース編集者として、私はAuto Browseが未来を示していると考える:AIは「質問応答マシン」から「実行者」へと変わり、ユーザーの手を解放する。しかし現在は未成熟で、大衆ではなくアーリーアダプターに適している。Googleはサンドボックス分離、ユーザーコントロール、透明性のあるログを強化すべきだ。長期的には、Web3と分散型アイデンティティとの組み合わせが信頼問題を解決するかもしれない。安定版Chrome 120に期待しており、それはインターネットのパラダイムを再構築するかもしれない。
総じて、Auto Browseの「驚異と惨敗」はAIエージェントの両刃の剣を映し出している:イノベーションが加速する一方で、信頼性のバランスが必要だ。開発者とユーザーは共に努力すべきである。
(本文約1050字)
本文はArs Technicaから編訳、著者Ryan Whitwam、原文日付2026-02-12。
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接