AI+Web3 em colaboração: desbloquear um novo paradigma de dados e Poder de computação

AI+Web3: Torres e Praças

Pontos principais

  1. Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se em: utilizar incentivos distribuídos para coordenar o potencial de oferta na cauda longa, envolvendo dados, armazenamento e computação; ao mesmo tempo, estabelecer modelos de código aberto e um mercado descentralizado para Agentes de IA.

  3. A IA é principalmente aplicada na indústria Web3 em finanças on-chain (pagamentos em criptomoedas, transações, análise de dados) e no apoio ao desenvolvimento.

  4. A utilidade do AI+Web3 é refletida na complementaridade entre ambos: o Web3 promete combater a centralização da AI, enquanto a AI promete ajudar o Web3 a expandir seu alcance.

AI+Web3: Torre e Praça

Introdução

Nos últimos dois anos, o desenvolvimento da IA tem mostrado uma tendência de aceleração. A onda de inteligência artificial generativa provocada pelo Chatgpt também gerou grandes ondas no campo do Web3.

Com o suporte do conceito de IA, o financiamento no mercado de criptomoedas aumentou significativamente. De acordo com estatísticas, no primeiro semestre de 2024, 64 projetos Web3+IA completaram financiamento, dos quais o sistema operativo baseado em inteligência artificial Zyber365 alcançou o maior valor de financiamento de 100 milhões de dólares na ronda A.

O mercado secundário está mais próspero, com o site de agregação de criptomoedas Coingecko mostrando que, em pouco mais de um ano, o valor total de mercado da área de IA atingiu 48,5 bilhões de dólares, com um volume de negociação de quase 8,6 bilhões de dólares nas últimas 24 horas. Os avanços nas principais tecnologias de IA trazem benefícios significativos; após o lançamento do modelo de conversão de texto em vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%. O efeito da IA também se estende a um dos setores de atração de capital em criptomoedas, os Memes: o primeiro MemeCoin com conceito de Agente de IA, o GOAT, rapidamente se tornou popular e alcançou uma valorização de 1,4 bilhão de dólares, conseguindo desencadear uma onda de Memes de IA.

A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin e, atualmente, AI Agent e AI DAO, a velocidade de rotação das novas narrativas torna difícil acompanhar a emoção do FOMO.

A combinação de termos AI+Web3, cheia de dinheiro fácil, oportunidades e fantasias sobre o futuro, não pode deixar de ser vista como um casamento arranjado promovido pelo capital. É difícil discernir por trás dessa aparência glamourosa se, na verdade, é o campo dos especuladores ou a véspera da explosão do amanhecer?

Para responder a esta pergunta, a chave está em pensar: ficará melhor com o outro? Será que podemos beneficiar-nos do modelo do outro? Este artigo tenta, apoiando-se nos ombros de gigantes, examinar este padrão: como o Web3 pode desempenhar um papel em cada etapa da pilha de tecnologia de IA e o que a IA pode trazer de novo ao Web3?

Oportunidades do Web3 sob a pilha de IA

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Os grandes modelos são como o cérebro humano; nas fases iniciais, assemelham-se a um recém-nascido, que precisa observar e absorver uma enorme quantidade de informações externas para entender o mundo. Esta é a fase de "coleta" de dados. Como os computadores não possuem os múltiplos sentidos humanos, é necessário, antes do treinamento, "pré-processar" as informações não rotuladas para transformá-las em um formato compreensível para o computador.

Após a entrada de dados, a IA constrói um modelo com capacidade de compreensão e previsão através do "treinamento", semelhante ao processo gradual de um bebê que aprende a entender o mundo exterior. Os parâmetros do modelo são como a capacidade linguística que o bebê ajusta continuamente. O conteúdo de aprendizagem é dividido por disciplinas ou obtido através da comunicação com outras pessoas para receber feedback e fazer correções, entrando na fase de "ajuste fino".

Após aprender a falar, as crianças conseguem entender o significado e expressar sentimentos e ideias em novas conversas, semelhante ao "raciocínio" dos grandes modelos de IA, que podem realizar previsões e análises sobre novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem problemas através da capacidade linguística, assim como os grandes modelos de IA são aplicados a diversas tarefas específicas, como classificação de imagens e reconhecimento de voz, após serem treinados na fase de raciocínio.

O Agente de IA está mais próximo da próxima forma dos grandes modelos - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possui capacidade de pensamento, mas também pode lembrar, planejar e interagir com o mundo utilizando ferramentas.

Em resposta aos pontos críticos de cada pilha de IA, o Web3 atualmente formou um ecossistema interconectado e multilayer, abrangendo todas as fases do processo de modelos de IA.

AI+Web3: Torres e Praças

Camada básica: Airbnb de poder computacional e dados

poder de cálculo

Atualmente, um dos maiores custos da IA é a potência computacional e a energia necessárias para treinar e inferir modelos.

Por exemplo, o LLAMA3 da Meta precisa de 16.000 GPUs NVIDIA H100 durante 30 dias para concluir o treinamento. O preço unitário da versão H100 de 80GB varia de 30.000 a 40.000 dólares, o que requer um investimento em hardware de computação entre 400 e 700 milhões de dólares (GPU + chip de rede), com um consumo de energia de 1,6 bilhões de quilowatts-hora por mês, resultando em despesas de energia de quase 20 milhões de dólares.

A descompressão do poder computacional da IA é também uma das primeiras áreas de interseção entre o Web3 e a IA — DePin (Rede de Infraestrutura Física Descentralizada). O site de dados DePin Ninja já listou mais de 1400 projetos, com projetos representativos de compartilhamento de poder de GPU, incluindo io.net, Aethir, Akash, Render Network, entre outros.

A lógica principal é: a plataforma permite que os proprietários de recursos GPU ociosos contribuam com capacidade de computação de forma descentralizada e sem necessidade de permissão, através de um mercado online semelhante ao Uber ou Airbnb, aumentando a utilização dos recursos GPU não totalmente aproveitados, enquanto os usuários finais obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking garante que os provedores de recursos tenham penalizações correspondentes se violarem o controle de qualidade ou interromperem a rede.

Características incluem:

  • Reunir recursos de GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de médio e pequeno porte, excessos de recursos de computação de mineradoras de criptomoedas, e hardware de mineração de mecanismos de consenso PoS, como FileCoin e máquinas de mineração ETH. Alguns projetos se dedicam a iniciar equipamentos com barreiras de entrada mais baixas, como a exolab que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para a inferência de grandes modelos.

  • Mercado de cauda longa voltado para a capacidade de computação AI: a. Lado técnico: o mercado de poder computacional descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados de GPUs em grande escala, enquanto a inferência tem requisitos de desempenho computacional de GPU relativamente baixos, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA. b. Lado da demanda: as pequenas e médias entidades de computação não treinarão seus próprios grandes modelos, mas apenas escolherão otimizar e ajustar em torno de poucos grandes modelos de destaque. Esses cenários são naturalmente adequados para recursos de computação ociosos distribuídos.

  • Propriedade descentralizada: O significado da tecnologia blockchain é que os proprietários de recursos mantêm sempre o controle sobre os recursos, podendo ajustá-los de forma flexível de acordo com a demanda, enquanto obtêm lucros.

Dados

Os dados são a base da IA. Sem dados, os cálculos são tão inúteis quanto plantas flutuantes. A relação entre dados e modelos é como o ditado "Garbage in, Garbage out"; a quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento atual de modelos de IA, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo os valores e a humanização do modelo. Atualmente, as dificuldades na demanda por dados em IA concentram-se nas seguintes quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de uma enorme quantidade de dados de entrada. Dados públicos mostram que a OpenAI treinou o GPT-4 com uma quantidade de parâmetros na casa dos trilhões.

  • Qualidade dos dados: Com a combinação da IA com vários setores, a atualidade, diversidade, especialização em dados verticais e novas fontes de dados, como a captação de emoções em redes sociais, impõem novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: Vários países e empresas estão gradualmente a reconhecer a importância de conjuntos de dados de qualidade e estão a impor restrições à extração de conjuntos de dados.

  • Custo elevado de processamento de dados: grande volume de dados, processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados para a coleta e processamento de dados básicos.

Atualmente, as soluções web3 manifestam-se nas seguintes quatro áreas:

  1. Coleta de dados: os dados do mundo real, fornecidos gratuitamente, estão rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam a cada ano. No entanto, esses gastos não estão retornando aos verdadeiros contribuidores de dados, e as plataformas desfrutam inteiramente da criação de valor trazida pelos dados, como o Reddit, que gerou um total de 203 milhões de dólares ao assinar acordos de autorização de dados com empresas de IA.

Permitir que os usuários que realmente contribuem também participem na criação de valor trazido pelos dados, e obter dados mais privados e valiosos dos usuários de forma de baixo custo através de uma rede distribuída e mecanismos de incentivo, é a visão do Web3.

  • Grass é uma camada de dados descentralizada e uma rede, onde os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão ao executar nós Grass para capturar dados em tempo real de toda a internet e obter recompensas em tokens.

  • A Vana introduz o conceito único de Pool de Liquidez de Dados (DLP), permitindo que os usuários façam upload de dados privados (como históricos de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolham de forma flexível se autorizam ou não o uso por terceiros específicos.

  • No PublicAI, os usuários podem usar #AI或#Web3 como etiqueta de classificação no X e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados de IA, como os dados coletados costumam ser ruidosos e conter erros, é necessário limpá-los e convertê-los para um formato utilizável antes de treinar o modelo, o que envolve tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, que deu origem à profissão de anotador de dados. À medida que a exigência de qualidade dos dados pelo modelo aumenta, a barreira de entrada para os anotadores de dados também se eleva, e esta tarefa é naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.
  • Grass e OpenLayer estão ambos a considerar a adição deste componente crítico de anotação de dados.

  • A Synesis propôs o conceito "Train2earn", enfatizando a qualidade dos dados, onde os usuários podem receber recompensas ao fornecer dados anotados, comentários ou outras formas de input.

  • O projeto de anotação de dados Sapien gamifica as tarefas de marcação e permite que os usuários apostem pontos para ganhar mais pontos.

  1. Privacidade e segurança de dados: é necessário esclarecer que privacidade de dados e segurança de dados são dois conceitos diferentes. A privacidade de dados envolve o tratamento de dados sensíveis, enquanto a segurança de dados protege as informações contra acesso não autorizado, destruição e roubo. Assim, as vantagens das tecnologias de privacidade do Web3 e os potenciais cenários de aplicação se manifestam em dois aspectos: (1) treinamento de dados sensíveis; (2) colaboração de dados: múltiplos proprietários de dados podem participar conjuntamente do treinamento de IA, sem a necessidade de compartilhar dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol.

  • Criptografia homomórfica totalmente (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network.

  • Tecnologia de zero conhecimento (zk), como o Protocolo Reclaim que utiliza a tecnologia zkTLS, gera provas de zero conhecimento do tráfego HTTPS, permitindo que os usuários importem com segurança dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, atualmente o campo ainda está em uma fase inicial, a maioria dos projetos ainda está em exploração, e a dificuldade atual é que os custos de computação são muito altos, por exemplo:

  • O framework zkML EZKL leva cerca de 80 minutos para gerar a prova do modelo 1M-nanoGPT.

  • De acordo com os dados da Modulus Labs, o custo do zkML é mais de 1000 vezes superior ao da computação pura.

  1. Armazenamento de Dados: Com os dados em mãos, é necessário um local na cadeia para armazenar os dados, bem como o LLM gerado a partir desses dados. Com a disponibilização de dados (DA) como questão central, antes da atualização do Danksharding no Ethereum, sua capacidade era de 0,08MB. Ao mesmo tempo, o treinamento de modelos de IA e a inferência em tempo real geralmente requerem uma capacidade de processamento de dados de 50 a 100GB por segundo. Essa diferença de magnitude torna as soluções atuais na cadeia incapazes de lidar com "aplicações de IA intensivas em recursos".
  • 0g.AI é o projeto representativo desta categoria. É uma solução de armazenamento centralizado projetada para atender às altas demandas de desempenho da IA, com características chave incluindo: alto desempenho e escalabilidade, suportando uploads e downloads rápidos de grandes conjuntos de dados através de tecnologias avançadas de fragmentação (Sharding) e codificação de apagamento (Erasure Coding), com velocidades de transferência de dados próximas a 5GB por segundo.

Middleware: Treinamento e Inferência de Modelos

Mercado descentralizado de modelos de código aberto

O debate sobre se os modelos de IA devem ser fechados ou abertos nunca desapareceu. A inovação coletiva trazida pelo código aberto é uma vantagem que os modelos fechados não conseguem igualar; no entanto, sem um modelo de lucro, como podem os modelos abertos aumentar a motivação dos desenvolvedores? É uma direção que merece reflexão. O fundador da Baidu, Li Yanhong, afirmou em abril deste ano que "os modelos abertos vão ficar cada vez mais para trás."

Neste sentido, o Web3 propõe a possibilidade de um mercado de modelos descentralizado e de código aberto, ou seja, a tokenização do próprio modelo, reservando uma certa proporção de tokens para a equipe e direcionando uma parte da receita futura desse modelo para os detentores de tokens.

  • O protocolo Bittensor estabelece um mercado P2P de modelos de código aberto, composto por várias "sub-redes", onde os provedores de recursos (computação, coleta/armazenamento de dados, talentos em aprendizado de máquina) competem entre si para atender aos objetivos dos proprietários de sub-rede específicos. As sub-redes podem interagir e aprender umas com as outras, resultando em uma inteligência mais poderosa. As recompensas são distribuídas por votação da comunidade e, posteriormente, alocadas com base no desempenho competitivo.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Compartilhar
Comentário
0/400
LiquidityNinjavip
· 2h atrás
fazer as pessoas de parvas não me move, eu sou um inquilino resistente
Ver originalResponder0
metaverse_hermitvip
· 21h atrás
Fazer dinheiro, não é vergonhoso.
Ver originalResponder0
OnchainHolmesvip
· 21h atrás
Ah, esta onda de especulação já chegou!
Ver originalResponder0
RektRecordervip
· 21h atrás
O capital já sente o cheiro dos idiotas.
Ver originalResponder0
SilentObservervip
· 21h atrás
Esta onda de IA é realmente forte.
Ver originalResponder0
GasFeeCrybabyvip
· 21h atrás
Quando é que pode cair?
Ver originalResponder0
SchroedingerMinervip
· 21h atrás
Blockchain碎碎念 A alegria do mineiro
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)