La IA está transformando el panorama de los navegadores, desde la presentación de información hasta la invocación de Agentes inteligentes.

robot
Generación de resúmenes en curso

Reconstrucción del navegador en la era de la IA: de la interacción humano-máquina a la llamada de agentes

La evolución de los navegadores

Los navegadores, como puerta de entrada a Internet, han pasado por un largo desarrollo desde Netscape hasta Chrome. La competencia inicial entre navegadores se centraba en la velocidad de renderizado y la experiencia del usuario, mientras que hoy el enfoque de la competencia se ha trasladado a la integración de capacidades de IA.

En los años 90, Netscape abrió el camino a la navegación gráfica, pero rápidamente fue superado por IE de Microsoft a través de estrategias de empaquetado del sistema. Firefox, gracias a su espíritu de código abierto y ecosistema de complementos, tuvo un auge momentáneo, pero finalmente fue superado por Chrome de Google gracias a su rápida iteración y experiencia multiplataforma.

En la era móvil, productos ligeros como el navegador UC tienen ventaja en mercados emergentes, pero con la proliferación de smartphones y cambios en las políticas, su influencia ha ido disminuyendo gradualmente. Hoy en día, Chrome se ha consolidado como el líder en el escritorio, con una participación de mercado global de aproximadamente el 65%.

Sin embargo, el auge de los grandes modelos de lenguaje está sacudiendo este patrón. Los usuarios tienden cada vez más a obtener información directamente en la página de resultados de búsqueda, y el comportamiento tradicional de hacer clic en páginas web está disminuyendo. Al mismo tiempo, los rumores de que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Google.

La inevitabilidad de que la IA reestructure los navegadores

A pesar de la poderosa capacidad de la IA, el navegador sigue siendo indispensable como plataforma general. Las razones son las siguientes:

  1. El navegador es un lugar de almacenamiento de datos personalizados, incluyendo contraseñas, cookies y otra información sensible.

  2. Las complejas conductas de los usuarios y las operaciones automatizadas deben realizarse dentro de un sandbox del navegador.

  3. El navegador proporciona un límite de confianza unificado y una interfaz de llamada a funciones.

  4. Una gran cantidad de datos contextuales se acumulan en el navegador, incluyendo pestañas, IndexedDB, etc.

Lo que realmente podría alterar el panorama actual de los navegadores no es otro "mejor Chrome", sino una nueva estructura de interacción: pasar de la exhibición de información a la ejecución de tareas. Los navegadores del futuro deben ser diseñados para Agentes de IA, capaces no solo de leer información, sino también de realizar operaciones complejas.

Exploración del nuevo navegador AI de próxima generación

Uso del Navegador

Browser Use ha construido una arquitectura de reconocimiento semántico que redecodifica el árbol DOM tradicional como "DOM semántico". Esto permite que el Agente AI pueda entender y operar directamente la estructura de la página web, sin necesidad de depender del reconocimiento visual o la localización por coordenadas.

Principales características:

  • Abstraer los elementos interactivos en fragmentos JSON, que incluyen metadatos como personajes y estados.
  • Traducir toda la página a una "lista de nodos semánticos" plana
  • Recibir instrucciones de alto nivel y mapearlas a operaciones reales del navegador

Perplejidad

Perplexity como motor de búsqueda AI está desarrollando un navegador nativo llamado Comet. Su idea central es integrar profundamente la IA en el núcleo del navegador, reemplazando los resultados de búsqueda tradicionales con respuestas sencillas.

Sin embargo, Perplexity sigue enfrentando el desafío de altos costos de búsqueda y bajas tasas de beneficio marginal de los usuarios. En comparación, Google está automatizando completamente su producto central a través del plan "Project Mariner".

Valiente

Brave se basa en la arquitectura Chromium, con un enfoque en la protección de la privacidad y la ganancia de tokens a través de la navegación. Aunque la base de usuarios sigue creciendo, la cuota de mercado sigue siendo pequeña.

Brave está planeando actualizarse a un navegador AI priorizando la privacidad, pero debido a la limitación en la obtención de datos de los usuarios, el grado de personalización de su modelo AI podría verse limitado. En la próxima era del navegador Agentic, Brave podría tener dificultades para convertirse en un jugador principal.

Donut

Como un proyecto emergente en el ámbito de Web3, Donut tiene como objetivo lograr una capacidad integrada de "exploración - decisión - ejecución nativa de criptomonedas". Su núcleo radica en combinar un camino de ejecución automática nativa de criptomonedas, proporcionando una interfaz operativa del mundo blockchain para los agentes de IA.

Reflexiones para emprendedores

  1. Estandarización de la estructura de la interfaz: asegurar que el producto pueda ser llamado por el Agente AI

    • Proporcionar una estructura DOM semántica o un mapeo JSON
    • Diseñar una máquina de estados estable y un mecanismo de reproducción de comportamientos
    • Soporte para la restauración de la interacción del usuario mediante scripts
    • Proporcionar WebHook o API Endpoint
  2. Identidad y acceso: ayudar al Agente a superar las barreras de confianza

    • Desarrollar una capa intermedia de confianza que soporte lectura de almacenamiento local, llamadas a billeteras, etc.
    • Diseñar una interfaz de llamada de activos unificada para el escenario Web3
  3. Reconstrucción del mecanismo de tráfico: de SEO a AEO/ATF

    • Descomponer el producto en unidades de capacidad llamables
    • Optimizar el proceso de registro, la interfaz de precios, la consulta de inventario, etc.
    • Sintaxis de llamada adaptada a diferentes marcos LLM

Las oportunidades de emprendimiento del futuro radican en construir la "sintaxis de la interfaz" del mundo de las llamadas de agentes, convirtiéndose en un eslabón clave de la cadena de confianza de los agentes, y en establecer el "castillo de API" en el nuevo modelo de búsqueda. El núcleo de la competencia en la era de Web3 + AI Agent es capturar la intención de ejecución del agente, en lugar de simplemente disputar la atención del usuario.

AGENT9.8%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
JustHodlItvip
· 07-21 16:37
Píldora del navegador tradicional
Ver originalesResponder0
BlockchainDecodervip
· 07-21 05:06
Citando datos de 10 instituciones de primer nivel, la eficiencia de ejecución de Agent es inferior al 12.3% de los navegadores actuales, la industrialización aún es prematura.
Ver originalesResponder0
WalletWhisperervip
· 07-21 05:06
No son más que navegadores de trampa de IA.
Ver originalesResponder0
GateUser-c802f0e8vip
· 07-21 05:01
Otra vez es un cheque en blanco que la IA puede cambiarlo todo.
Ver originalesResponder0
MEVSandwichMakervip
· 07-21 04:56
¡Los navegadores van a quedarse sin trabajo!
Ver originalesResponder0
OnChainArchaeologistvip
· 07-21 04:41
Esto es otra vez una ganancia.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)