AIがブラウザの構造を再構築する 情報表示からインテリジェントエージェントの呼び出しへ

robot
概要作成中

AI時代のブラウザ再構築:人間と機械の相互作用からエージェントの呼び出しへ

ブラウザの進化の歴史

ブラウザはインターネットの入り口として、NetscapeからChromeへの長い進化を遂げてきました。初期のブラウザ競争はレンダリング速度とユーザー体験に集中していましたが、今日の競争の焦点はAI機能の統合に移っています。

90年代、Netscapeはグラフィカルブラウジングの先駆けを開きましたが、すぐにマイクロソフトのIEにシステムバンドル戦略で敗れました。Firefoxはオープンソース精神とプラグインエコシステムによって一時的に台頭しましたが、最終的にはGoogleのChromeに迅速なイテレーションと全プラットフォーム体験で追い越されました。

モバイル時代に入り、UCブラウザなどの軽量製品が新興市場で優位を占めていますが、スマートフォンの普及と政策の変化に伴い、その影響力は徐々に衰退しています。現在、Chromeはデスクトップ端末での主導的な地位を確立しており、世界市場シェアは約65%です。

しかし、大規模言語モデルの台頭はこの状況を揺るがしています。ユーザーは検索結果ページで直接情報を取得することにますます傾いており、従来のウェブページのクリック行動は減少しています。同時に、AppleがSafariでデフォルトの検索エンジンを置き換えるという噂は、Googleの利益基盤にさらなる脅威を与えています。

AIがブラウザを再構築する必然性

AIの能力が強力であっても、ブラウザは依然として汎用プラットフォームとして欠かせない存在です。理由は以下の通りです:

  1. ブラウザはパーソナライズされたデータの保存場所であり、パスワードやCookieなどの敏感な情報を含みます。

  2. 複雑なユーザー行動と自動化操作は、ブラウザのサンドボックス内で完了する必要があります。

  3. ブラウザは統一された信頼の境界と機能呼び出しインターフェースを提供します。

  4. 大量のコンテキストデータがブラウザに蓄積されており、タブ、IndexedDBなどが含まれています。

本当に現在のブラウザの状況を覆す可能性があるのは、別の「より良いChrome」ではなく、新しいインタラクション構造です:情報の表示からタスクの呼び出しへと移行します。未来のブラウザはAIエージェントのために設計される必要があり、情報を読み取るだけでなく、複雑な操作を実行できる必要があります。

新しい世代のAIブラウザの探求

ブラウザ使用

Browser Useは、従来のDOMツリーを"セマンティックDOM"に再デコードするセマンティック認識アーキテクチャを構築しました。これにより、AIエージェントは視覚認識や座標位置に依存することなく、ウェブページの構造を直接理解し操作できるようになります。

主な機能:

  • インタラクティブ要素をJSONスニペットとして抽象化し、キャラクター、状態などのメタデータを含める
  • ページ全体をフラット化された「セマンティックノードリスト」に翻訳する
  • 高位の指示を受け取り、実際のブラウザ操作にマッピングする

パープレキシティ

PerplexityはAI検索エンジンとして、Cometというネイティブブラウザを開発しています。その核心理念は、AIをブラウザの底層に深く埋め込み、従来の検索結果の代わりに簡潔な回答を提供することです。

しかし、Perplexityは依然として高い検索コストと低い限界ユーザープロフィット率の課題に直面しています。それに対して、Googleは「Project Mariner」プランを通じてコア製品を全面的にスマート化しています。

ブレイブ

BraveはChromiumアーキテクチャに基づいており、プライバシー保護とブラウジングによるトークン獲得を主な特徴としています。ユーザー規模は増加し続けていますが、市場シェアは依然として小さいです。

Braveはプライバシー重視のAIブラウザにアップグレードする計画を立てていますが、ユーザーデータの取得が限られているため、そのAIモデルのカスタマイズの程度は制限される可能性があります。今後のAgentic Browser時代において、Braveは主要なプレイヤーになるのが難しいかもしれません。

ドーナツ

Web3分野の新興プロジェクトとして、Donutは「探索-決定-暗号ネイティブ実行」の統合能力を実現することを目指しています。その核心は、暗号ネイティブの自動実行パスを組み合わせて、AIエージェントにブロックチェーンの世界での操作インターフェースを提供することにあります。

起業家へのインスピレーション

  1. インターフェース構造の標準化:製品がAIエージェントによって呼び出されることを保証する

    • セマンティックなDOM構造またはJSONマッピングを提供
    • 安定した状態機械と行動再現メカニズムの設計
    • ユーザーインタラクションのスクリプト化された復元をサポート
    • WebHookまたはAPIエンドポイントを提供
  2. 身分と通行:Agentが信頼の障壁を越えるのを助ける

    • 信頼できるミドルレイヤーを開発し、ローカルストレージの読み取りやウォレットの呼び出しをサポート
    • Web3シーンのための統一された資産呼び出しインターフェースを設計する
  3. トラフィックメカニズムの再構築:SEOからAEO/ATFへ

    • 製品を呼び出し可能な能力ユニットに分解する
    • 登録プロセス、価格インターフェース、在庫照会などを最適化する
    • 異なるLLMフレームワークに適応した呼び出し構文

未来の起業機会は、エージェント呼び出しの世界の「インターフェース文法」を構築し、インテリジェントエージェントの信頼チェーンの中で重要な役割を果たし、次世代の検索モデルに「APIの城」を構築することです。Web3 + AIエージェント時代の競争の核心は、エージェントの実行意図を捉えることであり、単にユーザーの注意を奪い合うことではありません。

AGENT13.25%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 5
  • 共有
コメント
0/400
BlockchainDecodervip
· 11時間前
10のトップ機関のデータを引用すると、エージェントの実行効率は現在のブラウザの12.3%に満たず、産業化にはまだ早い。
原文表示返信0
WalletWhisperervip
· 11時間前
これは単なるAIシースブラウザではありません
原文表示返信0
GateUser-c802f0e8vip
· 11時間前
またAIがすべてを変えるショートポジションの小切手
原文表示返信0
MEVSandwichMakervip
· 11時間前
ブラウザは失業してしまうのか
原文表示返信0
OnChainArchaeologistvip
· 11時間前
また儲けたのかこれは
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)