Reconstrução do navegador na era da IA: da interação homem-máquina à chamada de agentes
A evolução dos navegadores
Os navegadores, como porta de entrada para a Internet, passaram por um longo desenvolvimento desde o Netscape até o Chrome. As disputas iniciais entre navegadores concentravam-se na velocidade de renderização e na experiência do usuário, enquanto o foco da concorrência hoje se deslocou para a integração das capacidades de IA.
Nos anos 90, a Netscape pioneirou a navegação gráfica, mas rapidamente foi derrotada pelo IE da Microsoft através de uma estratégia de bundling de sistema. O Firefox, com seu espírito de código aberto e ecossistema de plugins, chegou a emergir, mas acabou sendo superado pelo Chrome do Google, que se destacou pela rápida iteração e experiência em todas as plataformas.
Entrando na era móvel, produtos leves como o navegador UC dominam os mercados emergentes, mas com a popularização dos smartphones e mudanças nas políticas, sua influência tem diminuído gradualmente. Hoje, o Chrome já se estabeleceu como o líder absoluto no desktop, com uma quota de mercado de cerca de 65%.
No entanto, o surgimento de grandes modelos de linguagem está a abalar este cenário. Os utilizadores estão cada vez mais inclinados a obter informações diretamente na página de resultados de pesquisa, enquanto o comportamento de clicar em páginas da web tradicionais está a diminuir. Ao mesmo tempo, os rumores de que a Apple pode substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Google.
A necessidade da reestruturação do navegador pela IA
Apesar das capacidades poderosas da IA, o navegador como plataforma universal continua a ser indispensável. As razões são as seguintes:
O navegador é um local de armazenamento de dados personalizados, incluindo senhas, Cookies e outras informações sensíveis.
Comportamentos de utilizador complexos e operações automatizadas devem ser realizadas dentro de um sandbox do navegador.
O navegador fornece uma fronteira de confiança unificada e uma interface de chamada de função.
Uma grande quantidade de dados contextuais é acumulada no navegador, incluindo abas, IndexedDB, etc.
O que realmente pode revolucionar o atual panorama dos navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: a transição da exibição de informações para a chamada de tarefas. O futuro dos navegadores precisa ser projetado para Agentes de IA, que não apenas leiam informações, mas também executem operações complexas.
A exploração do novo navegador AI de última geração
Uso do Navegador
O Browser Use construiu uma arquitetura de reconhecimento semântico que redecodifica a árvore DOM tradicional em "DOM semântico". Isso permite que o Agente AI compreenda e opere diretamente na estrutura da página web, sem depender de reconhecimento visual ou localização por coordenadas.
Principais características:
Abstrair elementos interativos como fragmentos JSON, incluindo personagens, estados e outros metadados
Traduzir toda a página para uma "lista de nós semânticos" simplificada.
Receber instruções de nível superior e mapeá-las para operações reais do navegador
Perplexidade
Perplexity, como motor de busca de IA, está a desenvolver um navegador nativo chamado Comet. A sua ideia central é incorporar a IA profundamente na base do navegador, substituindo os resultados de busca tradicionais por respostas simples.
No entanto, a Perplexity ainda enfrenta desafios de altos custos de busca e baixas margens de lucro do usuário. Em contrapartida, o Google está a automatizar completamente o seu produto principal através do plano "Project Mariner".
Corajoso
Brave é baseado na arquitetura Chromium, focado na proteção da privacidade e na geração de tokens através da navegação. Embora a base de usuários continue a crescer, a quota de mercado ainda é pequena.
A Brave está a planear uma atualização para um navegador AI com foco na privacidade, mas devido à limitação na obtenção de dados dos utilizadores, o nível de personalização do seu modelo de AI pode ser restringido. Na próxima era do Agentic Browser, a Brave pode ter dificuldades em tornar-se um jogador principal.
Donut
Como um projeto emergente no campo do Web3, o Donut visa realizar uma capacidade integrada de "explorar - decidir - executar nativamente em criptomoeda". Seu núcleo está em combinar um caminho de execução automatizado nativo de criptomoeda, fornecendo uma interface de operação do mundo blockchain para agentes de IA.
Inspirações para Empreendedores
Normalização da estrutura da interface: garantir que o produto possa ser chamado pelo AI Agent
Fornecer uma estrutura DOM semântica ou mapeamento JSON
Projetar uma máquina de estados estável e um mecanismo de reprodução de comportamento
Suporte para a recuperação de interações do utilizador via scripting
Fornecer WebHook ou Endpoint API
Identidade e Acesso: Ajudar o Agente a ultrapassar barreiras de confiança
Desenvolver uma camada intermediária confiável, suportando leitura de armazenamento local, chamadas de carteira, etc.
Projetar uma interface de chamada de ativos unificada para cenários Web3
Reestruturação do mecanismo de tráfego: de SEO para AEO/ATF
Desmontar o produto em unidades de capacidade chamáveis
Otimizar o processo de registro, a interface de preços, a consulta de inventário, etc.
Sintaxe de chamada adaptada a diferentes estruturas LLM
As oportunidades de empreendedorismo no futuro residem na construção da "sintaxe de interface" para a chamada de agentes, tornando-se um elo-chave na cadeia de confiança dos agentes, e erguendo um "castelo de API" no novo modo de busca. O núcleo da competição na era Web3 + AI Agent é compreender a intenção de execução dos agentes, em vez de simplesmente disputar a atenção dos usuários.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
6
Partilhar
Comentar
0/400
JustHodlIt
· 07-21 16:37
pílula do navegador tradicional
Ver originalResponder0
BlockchainDecoder
· 07-21 05:06
Citando dados de 10 instituições de topo, a eficiência de execução do Agent é inferior a 12,3% dos navegadores atuais, a industrialização ainda está prematura.
Ver originalResponder0
WalletWhisperer
· 07-21 05:06
Não são todos apenas navegadores de pele de IA?
Ver originalResponder0
GateUser-c802f0e8
· 07-21 05:01
Outra vez um cheque em branco de que a IA pode mudar tudo
A IA está a reformular o panorama dos navegadores, passando da apresentação de informações à invocação de Agentes Inteligentes.
Reconstrução do navegador na era da IA: da interação homem-máquina à chamada de agentes
A evolução dos navegadores
Os navegadores, como porta de entrada para a Internet, passaram por um longo desenvolvimento desde o Netscape até o Chrome. As disputas iniciais entre navegadores concentravam-se na velocidade de renderização e na experiência do usuário, enquanto o foco da concorrência hoje se deslocou para a integração das capacidades de IA.
Nos anos 90, a Netscape pioneirou a navegação gráfica, mas rapidamente foi derrotada pelo IE da Microsoft através de uma estratégia de bundling de sistema. O Firefox, com seu espírito de código aberto e ecossistema de plugins, chegou a emergir, mas acabou sendo superado pelo Chrome do Google, que se destacou pela rápida iteração e experiência em todas as plataformas.
Entrando na era móvel, produtos leves como o navegador UC dominam os mercados emergentes, mas com a popularização dos smartphones e mudanças nas políticas, sua influência tem diminuído gradualmente. Hoje, o Chrome já se estabeleceu como o líder absoluto no desktop, com uma quota de mercado de cerca de 65%.
No entanto, o surgimento de grandes modelos de linguagem está a abalar este cenário. Os utilizadores estão cada vez mais inclinados a obter informações diretamente na página de resultados de pesquisa, enquanto o comportamento de clicar em páginas da web tradicionais está a diminuir. Ao mesmo tempo, os rumores de que a Apple pode substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Google.
A necessidade da reestruturação do navegador pela IA
Apesar das capacidades poderosas da IA, o navegador como plataforma universal continua a ser indispensável. As razões são as seguintes:
O navegador é um local de armazenamento de dados personalizados, incluindo senhas, Cookies e outras informações sensíveis.
Comportamentos de utilizador complexos e operações automatizadas devem ser realizadas dentro de um sandbox do navegador.
O navegador fornece uma fronteira de confiança unificada e uma interface de chamada de função.
Uma grande quantidade de dados contextuais é acumulada no navegador, incluindo abas, IndexedDB, etc.
O que realmente pode revolucionar o atual panorama dos navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: a transição da exibição de informações para a chamada de tarefas. O futuro dos navegadores precisa ser projetado para Agentes de IA, que não apenas leiam informações, mas também executem operações complexas.
A exploração do novo navegador AI de última geração
Uso do Navegador
O Browser Use construiu uma arquitetura de reconhecimento semântico que redecodifica a árvore DOM tradicional em "DOM semântico". Isso permite que o Agente AI compreenda e opere diretamente na estrutura da página web, sem depender de reconhecimento visual ou localização por coordenadas.
Principais características:
Perplexidade
Perplexity, como motor de busca de IA, está a desenvolver um navegador nativo chamado Comet. A sua ideia central é incorporar a IA profundamente na base do navegador, substituindo os resultados de busca tradicionais por respostas simples.
No entanto, a Perplexity ainda enfrenta desafios de altos custos de busca e baixas margens de lucro do usuário. Em contrapartida, o Google está a automatizar completamente o seu produto principal através do plano "Project Mariner".
Corajoso
Brave é baseado na arquitetura Chromium, focado na proteção da privacidade e na geração de tokens através da navegação. Embora a base de usuários continue a crescer, a quota de mercado ainda é pequena.
A Brave está a planear uma atualização para um navegador AI com foco na privacidade, mas devido à limitação na obtenção de dados dos utilizadores, o nível de personalização do seu modelo de AI pode ser restringido. Na próxima era do Agentic Browser, a Brave pode ter dificuldades em tornar-se um jogador principal.
Donut
Como um projeto emergente no campo do Web3, o Donut visa realizar uma capacidade integrada de "explorar - decidir - executar nativamente em criptomoeda". Seu núcleo está em combinar um caminho de execução automatizado nativo de criptomoeda, fornecendo uma interface de operação do mundo blockchain para agentes de IA.
Inspirações para Empreendedores
Normalização da estrutura da interface: garantir que o produto possa ser chamado pelo AI Agent
Identidade e Acesso: Ajudar o Agente a ultrapassar barreiras de confiança
Reestruturação do mecanismo de tráfego: de SEO para AEO/ATF
As oportunidades de empreendedorismo no futuro residem na construção da "sintaxe de interface" para a chamada de agentes, tornando-se um elo-chave na cadeia de confiança dos agentes, e erguendo um "castelo de API" no novo modo de busca. O núcleo da competição na era Web3 + AI Agent é compreender a intenção de execução dos agentes, em vez de simplesmente disputar a atenção dos usuários.