Реконструкция браузера в эпоху ИИ: от взаимодействия человек-машина к вызову агентов
Эволюция браузеров
Браузер, как вход в интернет, прошел долгий путь от Netscape до Chrome. Ранняя борьба между браузерами сосредоточивалась на скорости рендеринга и пользовательском опыте, а сегодня акцент конкуренции сместился на интеграцию возможностей ИИ.
В 90-х годах Netscape положил начало графическому веб-браузингу, но вскоре был побежден Microsoft IE благодаря стратегии системной привязки. Firefox на время возродился благодаря духу открытого кода и экосистеме плагинов, но в конечном итоге был превзойден Google Chrome благодаря быстрой итерации и кроссплатформенному опыту.
В эпоху мобильных технологий легковесные продукты, такие как браузер UC, занимают преимущества на новых рынках, но с распространением смартфонов и изменением политики их влияние постепенно угасает. Сегодня Chrome прочно занимает позицию лидера на настольных компьютерах, его доля на мировом рынке составляет около 65%.
Тем не менее, рост больших языковых моделей потрясает эту структуру. Пользователи все больше склоняются к тому, чтобы получать информацию непосредственно на странице результатов поиска, в то время как традиционное поведение по кликам на веб-страницы снижается. В то же время слухи о том, что Apple может заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Google.
Необходимость переоснащения браузера с помощью ИИ
Несмотря на мощные возможности ИИ, браузер как универсальная платформа по-прежнему незаменим. Вот причины:
Браузер является местом хранения персонализированных данных, включая пароли, файлы cookie и другую конфиденциальную информацию.
Сложные действия пользователей и автоматизированные операции должны выполняться в песочнице браузера.
Браузер предоставляет единый предел доверия и интерфейсы вызова функций.
Большое количество контекстных данных сохраняется в браузере, включая вкладки, IndexedDB и т.д.
На самом деле, то, что может действительно изменить текущую ситуацию с браузерами, это не другой "лучший Chrome", а новая структура взаимодействия: переход от представления информации к выполнению задач. Будущие браузеры должны быть спроектированы для AI Agent, который не только может считывать информацию, но и выполнять сложные операции.
Исследование нового поколения AI браузеров
Использование браузера
Browser Use построил архитектуру семантического распознавания, которая декодирует традиционное дерево DOM в "семантическое DOM". Это позволяет AI Agent напрямую понимать и управлять структурой веб-страницы, не полагаясь на визуальное распознавание или координатное позиционирование.
Основные характеристики:
Абстрагировать интерактивные элементы в виде фрагментов JSON, содержащих метаданные о персонажах, состояниях и т.д.
Перевести всю страницу в плоский "список семантических узлов"
Получение высших команд и их преобразование в реальные действия в браузере
Перплексити
Perplexity как AI поисковая система разрабатывает нативный браузер под названием Comet. Его основная идея заключается в глубокой интеграции AI на уровне браузера, заменяя традиционные результаты поиска простыми ответами.
Тем не менее, Perplexity по-прежнему сталкивается с высокими затратами на поиск и низкой маржой прибыли пользователей. В сравнении с этим, Google полностью интеллектуализирует свои ключевые продукты через программу "Project Mariner".
Храбрый
Brave основан на архитектуре Chromium, основной акцент делается на защиту конфиденциальности и заработок токенов при просмотре. Хотя количество пользователей продолжает расти, доля рынка все еще остается небольшой.
Brave планирует перейти на AI-браузер с приоритетом конфиденциальности, но из-за ограниченного доступа к данным пользователей степень кастомизации его AI-моделей может быть ограничена. В предстоящую эпоху Agentic Browser Brave может столкнуться с трудностями на пути к тому, чтобы стать основным игроком.
Пончик
Как новый проект в сфере Web3, Donut стремится реализовать интегрированные возможности "исследование - принятие решений - крипто-родное выполнение". Его суть заключается в сочетании крипто-родных автоматизированных путей выполнения, предоставляя AI Agent интерфейсы для операций в блокчейн-мире.
Уроки для предпринимателей
Стандартизация структуры интерфейса: обеспечить возможность вызова продукта агентом ИИ
Предоставить семантическую структуру DOM или JSON отображение
Разработка стабильной машины состояний и механизма воспроизведения поведения
Поддержка скриптового восстановления взаимодействия с пользователем
Предоставьте WebHook или API Endpoint
Идентификация и доступ: помочь агенту преодолеть барьеры доверия
Разработка надежного промежуточного слоя, поддерживающего чтение локального хранилища, вызовы кошелька и т.д.
Разработка единого интерфейса вызова активов для сценариев Web3
Реконструкция механизма трафика: от SEO к AEO/ATF
Разделите продукт на вызываемые единицы возможностей
Оптимизация процесса регистрации, интерфейса ценообразования, поиска запасов и т.д.
Синтаксис вызова, совместимый с различными LLM-рамками
Будущие предпринимательские возможности заключаются в создании "синтаксиса интерфейса" для вызова агентов, что станет ключевым элементом цепочки доверия интеллектуальных агентов, а также в построении "API-крепостей" в новой парадигме поиска. Ядром конкурентной борьбы в эпоху Web3 + AI Agent является захват намерений выполнения агента, а не просто борьба за внимание пользователей.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
13 Лайков
Награда
13
6
Поделиться
комментарий
0/400
JustHodlIt
· 07-21 16:37
Традиционная браузерная таблетка
Посмотреть ОригиналОтветить0
BlockchainDecoder
· 07-21 05:06
Ссылаясь на данные 10 ведущих учреждений, эффективность выполнения Agent составляет менее 12,3% от текущих браузеров, а индустриализация еще слишком ранняя.
Искусственный интеллект меняет ландшафт браузеров: от отображения информации до вызова интеллектуальных агентов.
Реконструкция браузера в эпоху ИИ: от взаимодействия человек-машина к вызову агентов
Эволюция браузеров
Браузер, как вход в интернет, прошел долгий путь от Netscape до Chrome. Ранняя борьба между браузерами сосредоточивалась на скорости рендеринга и пользовательском опыте, а сегодня акцент конкуренции сместился на интеграцию возможностей ИИ.
В 90-х годах Netscape положил начало графическому веб-браузингу, но вскоре был побежден Microsoft IE благодаря стратегии системной привязки. Firefox на время возродился благодаря духу открытого кода и экосистеме плагинов, но в конечном итоге был превзойден Google Chrome благодаря быстрой итерации и кроссплатформенному опыту.
В эпоху мобильных технологий легковесные продукты, такие как браузер UC, занимают преимущества на новых рынках, но с распространением смартфонов и изменением политики их влияние постепенно угасает. Сегодня Chrome прочно занимает позицию лидера на настольных компьютерах, его доля на мировом рынке составляет около 65%.
Тем не менее, рост больших языковых моделей потрясает эту структуру. Пользователи все больше склоняются к тому, чтобы получать информацию непосредственно на странице результатов поиска, в то время как традиционное поведение по кликам на веб-страницы снижается. В то же время слухи о том, что Apple может заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Google.
Необходимость переоснащения браузера с помощью ИИ
Несмотря на мощные возможности ИИ, браузер как универсальная платформа по-прежнему незаменим. Вот причины:
Браузер является местом хранения персонализированных данных, включая пароли, файлы cookie и другую конфиденциальную информацию.
Сложные действия пользователей и автоматизированные операции должны выполняться в песочнице браузера.
Браузер предоставляет единый предел доверия и интерфейсы вызова функций.
Большое количество контекстных данных сохраняется в браузере, включая вкладки, IndexedDB и т.д.
На самом деле, то, что может действительно изменить текущую ситуацию с браузерами, это не другой "лучший Chrome", а новая структура взаимодействия: переход от представления информации к выполнению задач. Будущие браузеры должны быть спроектированы для AI Agent, который не только может считывать информацию, но и выполнять сложные операции.
Исследование нового поколения AI браузеров
Использование браузера
Browser Use построил архитектуру семантического распознавания, которая декодирует традиционное дерево DOM в "семантическое DOM". Это позволяет AI Agent напрямую понимать и управлять структурой веб-страницы, не полагаясь на визуальное распознавание или координатное позиционирование.
Основные характеристики:
Перплексити
Perplexity как AI поисковая система разрабатывает нативный браузер под названием Comet. Его основная идея заключается в глубокой интеграции AI на уровне браузера, заменяя традиционные результаты поиска простыми ответами.
Тем не менее, Perplexity по-прежнему сталкивается с высокими затратами на поиск и низкой маржой прибыли пользователей. В сравнении с этим, Google полностью интеллектуализирует свои ключевые продукты через программу "Project Mariner".
Храбрый
Brave основан на архитектуре Chromium, основной акцент делается на защиту конфиденциальности и заработок токенов при просмотре. Хотя количество пользователей продолжает расти, доля рынка все еще остается небольшой.
Brave планирует перейти на AI-браузер с приоритетом конфиденциальности, но из-за ограниченного доступа к данным пользователей степень кастомизации его AI-моделей может быть ограничена. В предстоящую эпоху Agentic Browser Brave может столкнуться с трудностями на пути к тому, чтобы стать основным игроком.
Пончик
Как новый проект в сфере Web3, Donut стремится реализовать интегрированные возможности "исследование - принятие решений - крипто-родное выполнение". Его суть заключается в сочетании крипто-родных автоматизированных путей выполнения, предоставляя AI Agent интерфейсы для операций в блокчейн-мире.
Уроки для предпринимателей
Стандартизация структуры интерфейса: обеспечить возможность вызова продукта агентом ИИ
Идентификация и доступ: помочь агенту преодолеть барьеры доверия
Реконструкция механизма трафика: от SEO к AEO/ATF
Будущие предпринимательские возможности заключаются в создании "синтаксиса интерфейса" для вызова агентов, что станет ключевым элементом цепочки доверия интеллектуальных агентов, а также в построении "API-крепостей" в новой парадигме поиска. Ядром конкурентной борьбы в эпоху Web3 + AI Agent является захват намерений выполнения агента, а не просто борьба за внимание пользователей.