Reconstruction des navigateurs à l'ère de l'IA : de l'interaction homme-machine à l'appel d'Agent
L'évolution des navigateurs
Les navigateurs, en tant qu'entrée sur Internet, ont connu un long développement allant de Netscape à Chrome. Au début, la compétition entre les navigateurs se concentrait sur la vitesse de rendu et l'expérience utilisateur, tandis qu'aujourd'hui, le point focal de la concurrence s'est déplacé vers l'intégration des capacités d'IA.
Dans les années 90, Netscape a ouvert la voie à la navigation graphique, mais a rapidement été vaincu par la stratégie de bundling de Microsoft avec IE. Firefox a connu un essor grâce à son esprit open source et son écosystème de plugins, mais a finalement été dépassé par Chrome de Google en raison de son itération rapide et de son expérience multiplateforme.
À l'ère mobile, des produits légers comme UC Browser dominent sur les nouveaux marchés, mais avec la popularité des smartphones et les changements de politique, leur influence diminue progressivement. Aujourd'hui, Chrome est solidement installé en tant que leader sur le bureau, avec une part de marché mondiale d'environ 65 %.
Cependant, l'essor des grands modèles linguistiques bouleverse ce paysage. Les utilisateurs ont de plus en plus tendance à obtenir des informations directement sur la page des résultats de recherche, tandis que le comportement traditionnel de clic sur les pages web diminue. Parallèlement, les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent encore davantage les bases de profit de Google.
L'inévitabilité de la transformation des navigateurs par l'IA
Bien que les capacités de l'IA soient puissantes, le navigateur en tant que plateforme universelle reste indispensable. Voici les raisons :
Le navigateur est un lieu de stockage de données personnalisées, y compris les mots de passe, les cookies et d'autres informations sensibles.
Les comportements utilisateurs complexes et les opérations automatisées doivent être réalisés dans un environnement de navigateur sandbox.
Le navigateur fournit une frontière de confiance unifiée et une interface d'appel de fonction.
Une grande quantité de données contextuelles est stockée dans le navigateur, y compris les onglets, IndexedDB, etc.
Ce qui pourrait vraiment bouleverser le paysage actuel des navigateurs, ce n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : passer de l'affichage d'informations à l'appel de tâches. Les navigateurs de demain devront être conçus pour les agents IA, capables non seulement de lire des informations, mais aussi d'exécuter des opérations complexes.
Exploration du nouveau navigateur AI de nouvelle génération
Utilisation du navigateur
Browser Use a construit une architecture de reconnaissance sémantique qui redécodifie l'arbre DOM traditionnel en "DOM sémantique". Cela permet à l'Agent AI de comprendre et d'opérer directement sur la structure des pages web, sans avoir besoin de s'appuyer sur la reconnaissance visuelle ou le positionnement par coordonnées.
Principales caractéristiques :
Abstraire les éléments interactifs en fragments JSON, contenant des métadonnées telles que des rôles, des états, etc.
Traduire la page entière en une "liste de nœuds sémantiques" aplatie.
Recevoir les instructions de haut niveau et les mapper aux actions réelles du navigateur
Perplexité
Perplexity, en tant que moteur de recherche AI, développe un navigateur natif nommé Comet. Son idée centrale est d'intégrer profondément l'IA dans le noyau du navigateur, remplaçant les résultats de recherche traditionnels par des réponses concises.
Cependant, Perplexity fait toujours face à des défis de coûts de recherche élevés et de faibles marges bénéficiaires pour les utilisateurs. En revanche, Google rationalise entièrement ses produits phares grâce au programme "Project Mariner".
Brave
Brave est basé sur l'architecture Chromium, axé sur la protection de la vie privée et la génération de revenus en naviguant. Bien que la taille des utilisateurs continue de croître, sa part de marché reste relativement faible.
Brave prévoit de se transformer en navigateur AI axé sur la confidentialité, mais en raison de l'accès limité aux données des utilisateurs, le degré de personnalisation de son modèle AI pourrait être restreint. À l'ère du prochain navigateur Agentic, Brave pourrait avoir du mal à devenir un acteur majeur.
Donut
En tant que projet émergent dans le domaine du Web3, Donut vise à réaliser une capacité intégrée d'"exploration - décision - exécution native cryptographique". Son cœur réside dans la combinaison de chemins d'exécution automatisés natifs à la cryptographie, fournissant une interface opérationnelle pour les agents d'IA dans le monde de la blockchain.
Inspirations pour les entrepreneurs
Normalisation de la structure des interfaces : garantir que le produit puisse être appelé par un agent AI.
Fournir une structure DOM sémantique ou une cartographie JSON
Concevoir des machines à états stables et des mécanismes de reproduction de comportement
Prise en charge de la restauration scriptée des interactions utilisateur
Fournir un WebHook ou un point de terminaison API
Identité et accès : aider l'Agent à franchir les barrières de confiance
Développer une couche intermédiaire fiable, prenant en charge la lecture du stockage local, les appels de portefeuille, etc.
Concevoir une interface d'appel d'actifs unifiée pour les scénarios Web3
Reconfiguration du mécanisme de trafic : de SEO à AEO/ATF
Décomposer le produit en unités de capacité appelables
Optimiser le processus d'inscription, l'interface de tarification, la recherche de stock, etc.
Syntaxe d'appel adaptée à différents cadres LLM
Les opportunités d'entrepreneuriat à l'avenir résident dans la construction de la "syntaxe d'interface" pour l'appel des Agents, devenant un maillon clé de la chaîne de confiance des agents, et construisant le "château API" dans le nouveau modèle de recherche. Le cœur de la concurrence à l'ère de Web3 + AI Agent est de saisir l'intention d'exécution de l'Agent, plutôt que de simplement lutter pour l'attention des utilisateurs.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
13 J'aime
Récompense
13
6
Partager
Commentaire
0/400
JustHodlIt
· 07-21 16:37
Pilule de navigateur traditionnel
Voir l'originalRépondre0
BlockchainDecoder
· 07-21 05:06
En se basant sur les données de 10 institutions de premier plan, l'efficacité d'exécution d'Agent est inférieure à 12,3 % de celle des navigateurs actuels, et la commercialisation est prématurée.
Voir l'originalRépondre0
WalletWhisperer
· 07-21 05:06
Ce ne sont que des navigateurs piégés par l'IA.
Voir l'originalRépondre0
GateUser-c802f0e8
· 07-21 05:01
Encore un chèque en blanc de l'IA qui peut tout changer
L'IA redéfinit le paysage des navigateurs, passant de l'affichage d'informations à l'appel d'agents intelligents.
Reconstruction des navigateurs à l'ère de l'IA : de l'interaction homme-machine à l'appel d'Agent
L'évolution des navigateurs
Les navigateurs, en tant qu'entrée sur Internet, ont connu un long développement allant de Netscape à Chrome. Au début, la compétition entre les navigateurs se concentrait sur la vitesse de rendu et l'expérience utilisateur, tandis qu'aujourd'hui, le point focal de la concurrence s'est déplacé vers l'intégration des capacités d'IA.
Dans les années 90, Netscape a ouvert la voie à la navigation graphique, mais a rapidement été vaincu par la stratégie de bundling de Microsoft avec IE. Firefox a connu un essor grâce à son esprit open source et son écosystème de plugins, mais a finalement été dépassé par Chrome de Google en raison de son itération rapide et de son expérience multiplateforme.
À l'ère mobile, des produits légers comme UC Browser dominent sur les nouveaux marchés, mais avec la popularité des smartphones et les changements de politique, leur influence diminue progressivement. Aujourd'hui, Chrome est solidement installé en tant que leader sur le bureau, avec une part de marché mondiale d'environ 65 %.
Cependant, l'essor des grands modèles linguistiques bouleverse ce paysage. Les utilisateurs ont de plus en plus tendance à obtenir des informations directement sur la page des résultats de recherche, tandis que le comportement traditionnel de clic sur les pages web diminue. Parallèlement, les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent encore davantage les bases de profit de Google.
L'inévitabilité de la transformation des navigateurs par l'IA
Bien que les capacités de l'IA soient puissantes, le navigateur en tant que plateforme universelle reste indispensable. Voici les raisons :
Le navigateur est un lieu de stockage de données personnalisées, y compris les mots de passe, les cookies et d'autres informations sensibles.
Les comportements utilisateurs complexes et les opérations automatisées doivent être réalisés dans un environnement de navigateur sandbox.
Le navigateur fournit une frontière de confiance unifiée et une interface d'appel de fonction.
Une grande quantité de données contextuelles est stockée dans le navigateur, y compris les onglets, IndexedDB, etc.
Ce qui pourrait vraiment bouleverser le paysage actuel des navigateurs, ce n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : passer de l'affichage d'informations à l'appel de tâches. Les navigateurs de demain devront être conçus pour les agents IA, capables non seulement de lire des informations, mais aussi d'exécuter des opérations complexes.
Exploration du nouveau navigateur AI de nouvelle génération
Utilisation du navigateur
Browser Use a construit une architecture de reconnaissance sémantique qui redécodifie l'arbre DOM traditionnel en "DOM sémantique". Cela permet à l'Agent AI de comprendre et d'opérer directement sur la structure des pages web, sans avoir besoin de s'appuyer sur la reconnaissance visuelle ou le positionnement par coordonnées.
Principales caractéristiques :
Perplexité
Perplexity, en tant que moteur de recherche AI, développe un navigateur natif nommé Comet. Son idée centrale est d'intégrer profondément l'IA dans le noyau du navigateur, remplaçant les résultats de recherche traditionnels par des réponses concises.
Cependant, Perplexity fait toujours face à des défis de coûts de recherche élevés et de faibles marges bénéficiaires pour les utilisateurs. En revanche, Google rationalise entièrement ses produits phares grâce au programme "Project Mariner".
Brave
Brave est basé sur l'architecture Chromium, axé sur la protection de la vie privée et la génération de revenus en naviguant. Bien que la taille des utilisateurs continue de croître, sa part de marché reste relativement faible.
Brave prévoit de se transformer en navigateur AI axé sur la confidentialité, mais en raison de l'accès limité aux données des utilisateurs, le degré de personnalisation de son modèle AI pourrait être restreint. À l'ère du prochain navigateur Agentic, Brave pourrait avoir du mal à devenir un acteur majeur.
Donut
En tant que projet émergent dans le domaine du Web3, Donut vise à réaliser une capacité intégrée d'"exploration - décision - exécution native cryptographique". Son cœur réside dans la combinaison de chemins d'exécution automatisés natifs à la cryptographie, fournissant une interface opérationnelle pour les agents d'IA dans le monde de la blockchain.
Inspirations pour les entrepreneurs
Normalisation de la structure des interfaces : garantir que le produit puisse être appelé par un agent AI.
Identité et accès : aider l'Agent à franchir les barrières de confiance
Reconfiguration du mécanisme de trafic : de SEO à AEO/ATF
Les opportunités d'entrepreneuriat à l'avenir résident dans la construction de la "syntaxe d'interface" pour l'appel des Agents, devenant un maillon clé de la chaîne de confiance des agents, et construisant le "château API" dans le nouveau modèle de recherche. Le cœur de la concurrence à l'ère de Web3 + AI Agent est de saisir l'intention d'exécution de l'Agent, plutôt que de simplement lutter pour l'attention des utilisateurs.