Искусственный интеллект меняет ландшафт браузеров: от отображения информации до вызова интеллектуальных агентов.

robot
Генерация тезисов в процессе

Реконструкция браузера в эпоху ИИ: от взаимодействия человек-машина к вызову агентов

Эволюция браузеров

Браузер, как вход в интернет, прошел долгий путь от Netscape до Chrome. Ранняя борьба между браузерами сосредоточивалась на скорости рендеринга и пользовательском опыте, а сегодня акцент конкуренции сместился на интеграцию возможностей ИИ.

В 90-х годах Netscape положил начало графическому веб-браузингу, но вскоре был побежден Microsoft IE благодаря стратегии системной привязки. Firefox на время возродился благодаря духу открытого кода и экосистеме плагинов, но в конечном итоге был превзойден Google Chrome благодаря быстрой итерации и кроссплатформенному опыту.

В эпоху мобильных технологий легковесные продукты, такие как браузер UC, занимают преимущества на новых рынках, но с распространением смартфонов и изменением политики их влияние постепенно угасает. Сегодня Chrome прочно занимает позицию лидера на настольных компьютерах, его доля на мировом рынке составляет около 65%.

Тем не менее, рост больших языковых моделей потрясает эту структуру. Пользователи все больше склоняются к тому, чтобы получать информацию непосредственно на странице результатов поиска, в то время как традиционное поведение по кликам на веб-страницы снижается. В то же время слухи о том, что Apple может заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Google.

Необходимость переоснащения браузера с помощью ИИ

Несмотря на мощные возможности ИИ, браузер как универсальная платформа по-прежнему незаменим. Вот причины:

  1. Браузер является местом хранения персонализированных данных, включая пароли, файлы cookie и другую конфиденциальную информацию.

  2. Сложные действия пользователей и автоматизированные операции должны выполняться в песочнице браузера.

  3. Браузер предоставляет единый предел доверия и интерфейсы вызова функций.

  4. Большое количество контекстных данных сохраняется в браузере, включая вкладки, IndexedDB и т.д.

На самом деле, то, что может действительно изменить текущую ситуацию с браузерами, это не другой "лучший Chrome", а новая структура взаимодействия: переход от представления информации к выполнению задач. Будущие браузеры должны быть спроектированы для AI Agent, который не только может считывать информацию, но и выполнять сложные операции.

Исследование нового поколения AI браузеров

Использование браузера

Browser Use построил архитектуру семантического распознавания, которая декодирует традиционное дерево DOM в "семантическое DOM". Это позволяет AI Agent напрямую понимать и управлять структурой веб-страницы, не полагаясь на визуальное распознавание или координатное позиционирование.

Основные характеристики:

  • Абстрагировать интерактивные элементы в виде фрагментов JSON, содержащих метаданные о персонажах, состояниях и т.д.
  • Перевести всю страницу в плоский "список семантических узлов"
  • Получение высших команд и их преобразование в реальные действия в браузере

Перплексити

Perplexity как AI поисковая система разрабатывает нативный браузер под названием Comet. Его основная идея заключается в глубокой интеграции AI на уровне браузера, заменяя традиционные результаты поиска простыми ответами.

Тем не менее, Perplexity по-прежнему сталкивается с высокими затратами на поиск и низкой маржой прибыли пользователей. В сравнении с этим, Google полностью интеллектуализирует свои ключевые продукты через программу "Project Mariner".

Храбрый

Brave основан на архитектуре Chromium, основной акцент делается на защиту конфиденциальности и заработок токенов при просмотре. Хотя количество пользователей продолжает расти, доля рынка все еще остается небольшой.

Brave планирует перейти на AI-браузер с приоритетом конфиденциальности, но из-за ограниченного доступа к данным пользователей степень кастомизации его AI-моделей может быть ограничена. В предстоящую эпоху Agentic Browser Brave может столкнуться с трудностями на пути к тому, чтобы стать основным игроком.

Пончик

Как новый проект в сфере Web3, Donut стремится реализовать интегрированные возможности "исследование - принятие решений - крипто-родное выполнение". Его суть заключается в сочетании крипто-родных автоматизированных путей выполнения, предоставляя AI Agent интерфейсы для операций в блокчейн-мире.

Уроки для предпринимателей

  1. Стандартизация структуры интерфейса: обеспечить возможность вызова продукта агентом ИИ

    • Предоставить семантическую структуру DOM или JSON отображение
    • Разработка стабильной машины состояний и механизма воспроизведения поведения
    • Поддержка скриптового восстановления взаимодействия с пользователем
    • Предоставьте WebHook или API Endpoint
  2. Идентификация и доступ: помочь агенту преодолеть барьеры доверия

    • Разработка надежного промежуточного слоя, поддерживающего чтение локального хранилища, вызовы кошелька и т.д.
    • Разработка единого интерфейса вызова активов для сценариев Web3
  3. Реконструкция механизма трафика: от SEO к AEO/ATF

    • Разделите продукт на вызываемые единицы возможностей
    • Оптимизация процесса регистрации, интерфейса ценообразования, поиска запасов и т.д.
    • Синтаксис вызова, совместимый с различными LLM-рамками

Будущие предпринимательские возможности заключаются в создании "синтаксиса интерфейса" для вызова агентов, что станет ключевым элементом цепочки доверия интеллектуальных агентов, а также в построении "API-крепостей" в новой парадигме поиска. Ядром конкурентной борьбы в эпоху Web3 + AI Agent является захват намерений выполнения агента, а не просто борьба за внимание пользователей.

AGENT3.32%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
JustHodlItvip
· 07-21 16:37
Традиционная браузерная таблетка
Посмотреть ОригиналОтветить0
BlockchainDecodervip
· 07-21 05:06
Ссылаясь на данные 10 ведущих учреждений, эффективность выполнения Agent составляет менее 12,3% от текущих браузеров, а индустриализация еще слишком ранняя.
Посмотреть ОригиналОтветить0
WalletWhisperervip
· 07-21 05:06
Не все это просто ловушки браузеров на основе ИИ.
Посмотреть ОригиналОтветить0
GateUser-c802f0e8vip
· 07-21 05:01
又是 AI 能改变一切的 позиции в шорт 支票
Посмотреть ОригиналОтветить0
MEVSandwichMakervip
· 07-21 04:56
Браузеры скоро останутся без работы.
Посмотреть ОригиналОтветить0
OnChainArchaeologistvip
· 07-21 04:41
Снова заработал, да?
Посмотреть ОригиналОтветить0
  • Закрепить