AI+Web3 en colaboración: desbloqueando un nuevo patrón de datos y Potencia computacional

AI+Web3: Torres y Plazas

Puntos clave

  1. Los proyectos de Web3 con concepto de IA se han convertido en objetivos de captación de fondos en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: utilizar incentivos distribuidos para coordinar el suministro potencial en la larga cola, que incluye datos, almacenamiento y computación; al mismo tiempo, establecer modelos de código abierto y un mercado descentralizado para Agentes de IA.

  3. La IA se aplica principalmente en el sector Web3 a las finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y al desarrollo asistido.

  4. La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de contrarrestar la centralización de AI, y AI tiene la esperanza de ayudar a Web3 a romper barreras.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha mostrado una tendencia de aceleración. La ola de inteligencia artificial generativa provocada por Chatgpt también ha causado un gran impacto en el ámbito de Web3.

Con el apoyo del concepto de IA, la financiación del mercado de criptomonedas ha mejorado notablemente. Según estadísticas, en la primera mitad de 2024 se completaron 64 proyectos Web3+IA, entre los cuales el sistema operativo basado en inteligencia artificial Zyber365 logró la mayor financiación de 100 millones de dólares en la ronda A.

El mercado secundario es más próspero. Según los datos del sitio web de agregación de criptomonedas Coingecko, en poco más de un año, la capitalización total del sector de la IA ha alcanzado los 48,5 mil millones de dólares, y el volumen de transacciones en 24 horas se acerca a los 8,6 mil millones de dólares. Los avances en tecnologías de IA han traído beneficios claros; después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA aumentó un 151%. El efecto de la IA también se ha extendido a uno de los segmentos de atracción de capital en criptomonedas: Meme. El primer concepto de MemeCoin como Agente de IA, GOAT, se ha vuelto popular rápidamente y ha alcanzado una valoración de 1.400 millones de dólares, provocando un exitoso auge de los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y ahora los AI Agent y AI DAO actuales, la velocidad a la que cambian las nuevas narrativas hace que sea difícil seguir el FOMO.

La combinación de términos AI+Web3, llena de dinero caliente, oportunidades y fantasías futuras, inevitablemente se ve como un matrimonio concertado por el capital. Es difícil discernir, bajo esta lujosa fachada, si realmente es el escenario de los especuladores o si es la víspera de una explosión al amanecer.

Para responder a esta pregunta, la clave está en pensar: ¿mejorará si hay un oponente? ¿Se puede beneficiar de los patrones del oponente? Este artículo intenta examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada etapa de la pila tecnológica de la IA, y qué nueva vitalidad puede aportar la IA a Web3?

Oportunidades de Web3 en la pila de IA

Antes de abordar este tema, necesitamos comprender la pila tecnológica de los grandes modelos de IA:

Los grandes modelos son como el cerebro humano; en las primeras etapas, son como un bebé recién nacido, que necesita observar y absorber una gran cantidad de información del mundo exterior para comprenderlo. Esta es la etapa de "recolección" de datos. Dado que las computadoras no poseen los múltiples sentidos humanos, antes del entrenamiento es necesario "preprocesar" la información no etiquetada para convertirla en un formato comprensible para la computadora.

Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", similar al proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística en constante ajuste de un bebé. El contenido de aprendizaje se divide en disciplinas o se obtiene retroalimentación a través de la comunicación con personas y se corrige, ingresando a la etapa de "ajuste fino".

Después de que los niños crecen y aprenden a hablar, pueden entender el significado y expresar sentimientos e ideas en nuevos diálogos, similar al "razonamiento" de un modelo de IA grande, donde el modelo puede realizar análisis predictivos sobre nuevos inputs de lenguaje y texto. Los bebés expresan sentimientos, describen objetos y resuelven problemas a través de su capacidad lingüística, similar a cómo un modelo de IA grande se aplica en la fase de razonamiento a diversas tareas específicas, como la clasificación de imágenes, el reconocimiento de voz, etc.

El Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo posee capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

En respuesta a los puntos críticos de las diversas pilas de IA, Web3 ha comenzado a formar un ecosistema interconectado y de múltiples niveles que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torre y Plaza

Capa base: Airbnb de potencia de cálculo y datos

Potencia de cálculo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Por ejemplo, el LLAMA3 de Meta requiere 16,000 GPU NVIDIA H100 durante 30 días para completar el entrenamiento. El precio unitario de la versión H100 de 80GB es de entre 30,000 y 40,000 dólares, lo que implica una inversión en hardware de cálculo (GPU + chip de red) de entre 400 y 700 millones de dólares, con un consumo de energía mensual de 1.6 mil millones de kilovatios hora y un gasto energético cercano a los 20 millones de dólares.

La descompresión de la potencia de cálculo de la IA es también uno de los primeros campos donde Web3 se cruza con la IA: DePin (red de infraestructura física descentralizada). El sitio de datos DePin Ninja ha listado más de 1400 proyectos, y los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

La lógica principal es: la plataforma permite a los propietarios de recursos de GPU inactivos contribuir con capacidad de cómputo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea similar a Uber o Airbnb, aumentando la tasa de uso de recursos de GPU subutilizados, y los usuarios finales obtienen recursos de cómputo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking asegura que los proveedores de recursos tengan penalizaciones adecuadas si violan el control de calidad o interrumpen la red.

Características incluyen:

  • Reunir recursos GPU ociosos: Los proveedores son principalmente operadores de centros de datos independientes de terceros, granjas de criptomonedas, etc., que tienen recursos de potencia de cálculo excedentes, hardware de minería de mecanismos de consenso PoS, como las máquinas mineras de FileCoin y ETH. Algunos proyectos se dedican a iniciar dispositivos con barreras de entrada más bajas, como exolab, que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de potencia de cálculo que opere inferencias de modelos grandes.

  • Mercado de cola larga orientado a la potencia de cálculo de IA: a. Lado técnico: el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos de GPU a gran escala de clústeres, mientras que la inferencia tiene requisitos de rendimiento de GPU relativamente bajos, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de IA para inferencia. b. Lado de la demanda: las pequeñas y medianas empresas que requieren poder de cálculo no entrenarán su propio modelo grande, sino que solo elegirán optimizar y ajustar unos pocos modelos grandes de referencia, y estos escenarios son naturalmente adecuados para recursos de cálculo distribuidos y ociosos.

  • Propiedad descentralizada: el significado de la tecnología blockchain radica en que los propietarios de recursos siempre mantienen el control sobre ellos, pueden ajustarlos de manera flexible según la demanda y, al mismo tiempo, obtener beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como el alga flotante. La relación entre los datos y el modelo es como el refrán "Basura entra, basura sale"; la cantidad de datos y la calidad de la entrada determinan la calidad de la salida final del modelo. En la actualidad, para el entrenamiento de modelos de IA, los datos determinan la capacidad lingüística, la capacidad de comprensión e incluso los valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos para la IA se concentran principalmente en las siguientes cuatro áreas:

  • Sed de datos: El entrenamiento de modelos de IA depende de la entrada de grandes volúmenes de datos. Los datos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros en el rango de billones.

  • Calidad de los datos: A medida que la IA se combina con diversas industrias, la temporalidad, diversidad, especialización de datos verticales y nuevas fuentes de datos, como la captura de emociones en redes sociales, imponen nuevos requisitos a su calidad.

  • Problemas de privacidad y cumplimiento: los países y las empresas están comenzando a notar la importancia de los conjuntos de datos de calidad y están restringiendo la recopilación de conjuntos de datos.

  • Costos de procesamiento de datos elevados: gran volumen de datos y proceso de manejo complejo. Según la información pública, más del 30% de los costos de investigación y desarrollo de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se manifiestan en los siguientes cuatro aspectos:

  1. Recopilación de datos: Los datos del mundo real que se proporcionan de forma gratuita se están agotando rápidamente, y los gastos de las empresas de IA por datos aumentan cada año. Sin embargo, este gasto no se reinvierte en los verdaderos contribuyentes de datos, ya que las plataformas disfrutan plenamente de la creación de valor que aportan los datos, como Reddit, que logró ingresos totales de 203 millones de dólares mediante la firma de acuerdos de autorización de datos con empresas de IA.

Permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.

  • Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la internet y recibir recompensas en tokens.

  • Vana introduce el concepto único de pools de liquidez de datos (DLP), donde los usuarios pueden subir datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan su uso a terceros específicos.

  • En PublicAI, los usuarios pueden usar #AI或#Web3 como etiqueta de clasificación en X y @PublicAI para recopilar datos.

  1. Preprocesamiento de datos: Durante el proceso de procesamiento de datos de IA, dado que los datos recopilados suelen ser ruidosos y contener errores, es necesario limpiarlos y convertirlos a un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta etapa es uno de los pocos pasos manuales en la industria de la IA, y ha dado lugar a la industria de los etiquetadores de datos. A medida que los modelos aumentan sus requisitos de calidad de datos, el umbral para los etiquetadores de datos también se eleva, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizado de Web3.
  • Grass y OpenLayer están considerando incorporar la importante etapa de etiquetado de datos.

  • Synesis propone el concepto "Train2earn", enfatizando la calidad de los datos, los usuarios pueden obtener recompensas al proporcionar datos etiquetados, anotaciones u otras formas de contribución.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: es necesario aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al procesamiento de datos sensibles, mientras que la seguridad de los datos protege la información de los datos contra el acceso, destrucción y robo no autorizados. Así, las ventajas de la tecnología de privacidad en Web3 y los posibles escenarios de aplicación se reflejan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: múltiples propietarios de datos pueden participar juntos en el entrenamiento de IA sin necesidad de compartir los datos originales.

Las tecnologías de privacidad más comunes en Web3 incluyen:

  • Entorno de ejecución confiable (TEE), como Super Protocol.

  • Cifrado homomórfico completo (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network.

  • La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, lo que permite a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios web externos sin exponer información sensible.

Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, el dilema actual es que los costos computacionales son demasiado altos, por ejemplo:

  • El marco zkML EZKL necesita aproximadamente 80 minutos para generar la prueba del modelo 1M-nanoGPT.

  • Según los datos de Modulus Labs, el costo de zkML es más de 1000 veces mayor que el de la computación pura.

  1. Almacenamiento de datos: Una vez que se dispone de datos, también se necesita un lugar en la cadena para almacenar los datos, así como el LLM generado a partir de esos datos. Con la disponibilidad de datos (DA) como problema central, antes de la actualización de Danksharding de Ethereum, su capacidad de procesamiento era de 0.08MB. Al mismo tiempo, el entrenamiento de modelos de IA y la inferencia en tiempo real suelen requerir un volumen de datos de entre 50 y 100GB por segundo. Esta diferencia de magnitud deja a las soluciones existentes en la cadena incapaces de hacer frente a "aplicaciones de IA intensivas en recursos".
  • 0g.AI es un proyecto representativo de esta categoría. Es una solución de almacenamiento centralizado diseñada para satisfacer las altas demandas de rendimiento de la IA, con características clave que incluyen: alto rendimiento y escalabilidad, a través de tecnologías de fragmentación avanzada (Sharding) y codificación de borrado (Erasure Coding), soporta la carga y descarga rápidas de conjuntos de datos masivos, con una velocidad de transferencia de datos cercana a los 5GB por segundo.

Middleware: Entrenamiento e inferencia de modelos

Mercado descentralizado de modelos de código abierto

El debate sobre si los modelos de IA deben ser de código abierto o cerrado nunca ha desaparecido. La innovación colectiva que trae el código abierto es una ventaja incomparable frente a los modelos cerrados; sin embargo, ¿cómo pueden los modelos de código abierto aumentar la motivación de los desarrolladores sin un modelo de negocio rentable? Es una dirección que vale la pena considerar. El fundador de Baidu, Li Yanhong, afirmó en abril de este año que "los modelos de código abierto quedarán cada vez más rezagados."

En este sentido, Web3 propone la posibilidad de un mercado de modelos descentralizado y de código abierto, es decir, tokenizando el propio modelo, reservando un cierto porcentaje de tokens para el equipo y dirigiendo parte de los ingresos futuros del modelo hacia los titulares de tokens.

  • El protocolo Bittensor establece un mercado P2P de modelos de código abierto, compuesto por decenas de "subredes", donde los proveedores de recursos (cómputo, recolección/almacenamiento de datos, talento en aprendizaje automático) compiten entre sí para satisfacer los objetivos de los propietarios de subredes específicos. Las subredes pueden interactuar y aprender unas de otras, logrando una inteligencia más poderosa. Las recompensas se distribuyen mediante votación comunitaria y se distribuyen aún más según el desempeño en la competencia.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Compartir
Comentar
0/400
LiquidityNinjavip
· hace2h
tomar a la gente por tonta no me mueve, soy residente obstinado
Ver originalesResponder0
metaverse_hermitvip
· hace21h
Ganar dinero, no es vergonzoso.
Ver originalesResponder0
OnchainHolmesvip
· hace21h
¡Ah, esta ola de especulación está aquí de nuevo!
Ver originalesResponder0
RektRecordervip
· hace21h
El capital ha vuelto a oler el aroma de los tontos.
Ver originalesResponder0
SilentObservervip
· hace21h
Esta ola de IA es realmente fuerte.
Ver originalesResponder0
GasFeeCrybabyvip
· hace21h
¿Cuándo podrá caer?
Ver originalesResponder0
SchroedingerMinervip
· hace21h
Cadena de bloques fragmentos de pensamientos Minero feliz
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)