La fusión de la IA y Web3: mercado abierto y co-creación de valor

AI+Web3: Torres y plazas

TL;DR

  1. Los proyectos de Web3 con concepto de IA se convierten en objetivos de captación de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: usar incentivos distribuidos para coordinar el potencial de suministro en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para los Agentes de IA.

  3. La principal área de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos criptográficos, transacciones, análisis de datos) y el apoyo al desarrollo.

  4. La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 se espera que combata la centralización de AI, y AI se espera que ayude a Web3 a romper barreras.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; esta mariposa provocada por Chatgpt no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha generado un gran impulso en el Web3 al otro lado.

Con el respaldo del concepto de IA, la financiación en el mercado de criptomonedas, que se está desacelerando, se ha visto claramente impulsada. Según estadísticas de los medios, solo en la primera mitad de 2024, un total de 64 proyectos Web3+IA han completado financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto máximo de financiamiento de 100 millones de dólares en la ronda A.

El mercado secundario es aún más próspero. Según los datos de un sitio web de agregación de criptomonedas, en poco más de un año, la capitalización total del sector de IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones de casi 8.6 mil millones de dólares en 24 horas; los avances en tecnología de IA han traído beneficios evidentes, después del lanzamiento del modelo de OpenAI Sora que convierte texto en video, el precio promedio en el sector de IA ha aumentado un 151%; el efecto IA también se ha extendido a uno de los sectores que atraen capital en criptomonedas: Meme. El primer concepto de MemeCoin con IA, GOAT, se ha vuelto extremadamente popular y ha alcanzado una valoración de 1.4 mil millones de dólares, logrando así un gran auge en el Meme de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y actualmente AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de capital caliente, oportunidades y fantasías futuras, inevitablemente es vista como un matrimonio concertado por el capital; parece que nos resulta difícil discernir, bajo esta lujosa vestimenta, si realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿será mejor con el otro? ¿Se puede beneficiar de los modelos del otro? En este artículo, también tratamos de examinar este panorama desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los elementos de la pila de tecnología de IA, y qué nueva vitalidad puede traer la IA a Web3?

AI+Web3: Torres y Plaza

Parte 1 ¿Qué oportunidades hay para Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos comprender la pila tecnológica de los grandes modelos de IA:

Usando un lenguaje más sencillo para describir todo el proceso: el "gran modelo" es como el cerebro humano, en las primeras etapas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo, esta es la fase de "recolección" de datos; dado que las computadoras no poseen los sentidos como la vista y el oído de los humanos, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser transformada a través de "preprocesamiento" en un formato de información que las computadoras puedan entender y utilizar.

Después de ingresar los datos, la IA construyó un modelo con capacidades de comprensión y predicción a través de "entrenamiento", lo que se puede considerar como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística de un bebé que se ajusta constantemente durante el proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a especializarse, o se obtiene retroalimentación al comunicarse con otras personas y se hace correcciones, se entra en la fase de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "inferencia" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven varios problemas a través de su capacidad lingüística, lo cual también es similar a cómo los grandes modelos de IA se aplican en diversas tareas específicas en la fase de inferencia después de haber completado el entrenamiento, como la clasificación de imágenes, el reconocimiento de voz, etc.

Y el Agente de IA se acerca más a la próxima forma del gran modelo: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo posee capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema multilayer y conectado que abarca todas las etapas del proceso de modelos de IA.

Uno, Capa básica: Airbnb de potencia de cálculo y datos

Potencia de cálculo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que el LLAMA3 de Meta necesita 16,000 H100 GPU producidas por NVIDIA (que es una unidad de procesamiento gráfico de primer nivel diseñada específicamente para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). El entrenamiento tarda 30 días en completarse. El precio unitario de la versión de 80 GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de computación de entre 400 y 700 millones de dólares (GPU + chip de red), mientras que el entrenamiento mensual consume 1,600 millones de kilovatios hora, con gastos de energía cercanos a 20 millones de dólares al mes.

La descompresión de la potencia de cálculo de IA es, de hecho, uno de los primeros campos donde Web3 se cruza con la IA------DePin (red de infraestructura física descentralizada). Actualmente, un sitio web de datos ha enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que: la plataforma permite a individuos o entidades con recursos GPU inactivos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea similar al de compradores y vendedores de Uber o Airbnb, aumentando la tasa de utilización de recursos GPU que no se están aprovechando adecuadamente; al mismo tiempo, el mecanismo de staking también asegura que si se produce una violación del mecanismo de control de calidad o una interrupción de la red, los proveedores de recursos enfrentan las sanciones correspondientes.

Sus características son:

  • Reunir recursos de GPU ociosos: los proveedores son principalmente operadores de centros de datos independientes de tamaño mediano y pequeño de terceros, así como recursos de poder de cómputo excedentes de minas de criptomonedas, con mecanismos de consenso como el PoS para hardware de minería, como las máquinas mineras de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con un umbral de entrada más bajo, como exolab, que utiliza MacBook, iPhone, iPad y otros dispositivos locales para establecer una red de poder de cómputo para la inferencia de modelos grandes.

  • Enfrentando el mercado de larga cola de la potencia de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cómputo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que brinda un GPU de gran escala, mientras que la inferencia requiere un rendimiento de cómputo de GPU relativamente bajo, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde el lado de la demanda, los demandantes de capacidad de cálculo de pequeña y mediana escala no entrenarán su propio gran modelo de forma independiente, sino que solo elegirán optimizar y ajustar finamente alrededor de unos pocos grandes modelos líderes, y estos escenarios son naturalmente adecuados para los recursos de capacidad de cálculo distribuidos y ociosos.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándolos de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una hoja flotante, y la relación entre los datos y el modelo es como dice el refrán "Garbage in, Garbage out"; la cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. En el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística del modelo, su capacidad de comprensión, e incluso su visión del mundo y su expresión humanizada. Actualmente, las dificultades en la demanda de datos para la IA se centran principalmente en los siguientes cuatro aspectos:

  • Sed de datos: el entrenamiento de modelos de IA depende de una gran cantidad de entradas de datos. Los documentos públicos muestran que OpenAI entrenó GPT-4 con un número de parámetros que alcanzó niveles de billones.

  • Calidad de los datos: A medida que la IA se combina con diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, los diferentes países y empresas están comenzando a reconocer la importancia de los conjuntos de datos de alta calidad y están imponiendo restricciones a la recolección de conjuntos de datos.

  • Alto costo de procesamiento de datos: gran volumen de datos y proceso complejo. Los informes públicos muestran que más del 30% del costo de I+D de las empresas de IA se destina a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:

  1. Recopilación de datos: La disponibilidad de datos del mundo real que se pueden obtener de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA por los datos están aumentando año tras año. Sin embargo, al mismo tiempo, este gasto no se está traduciendo en beneficios para los verdaderos contribuyentes de los datos; las plataformas disfrutan plenamente de la creación de valor que aportan los datos, como una cierta plataforma social que logró ingresos totales de 203 millones de dólares a través de un acuerdo de autorización de datos con una empresa de IA.

Permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios a bajo costo a través de una red distribuida y mecanismos de incentivos, es la visión de Web3.

  • Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión ejecutando nodos de Grass para capturar datos en tiempo real de toda la internet y recibir recompensas en tokens;

  • Vana ha introducido un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;

  • En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en X y @PublicAI para realizar la recolección de datos.

  1. Preprocesamiento de datos: En el proceso de procesamiento de datos de AI, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y transformarse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y tratamiento de valores faltantes. Esta etapa es uno de los pocos pasos manuales en la industria de AI, y ha dado lugar a la industria de los etiquetadores de datos. A medida que las demandas de calidad de datos de los modelos aumentan, también lo hace el umbral para ser etiquetador de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos. Los usuarios pueden obtener recompensas proporcionando datos etiquetados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: Es necesario aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información contra el acceso, destrucción y robo no autorizados. Así, las ventajas de la tecnología de privacidad de Web3 y sus posibles escenarios de aplicación se reflejan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: múltiples propietarios de datos pueden participar en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 incluyen:

  • Entorno de ejecución confiable(TEE), como Super Protocol;

  • Cifrado homomórfico completamente (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;

  • La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero para el tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios web externos, sin revelar información sensible.

Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, uno de los dilemas actuales es que el costo de cálculo es demasiado alto, algunos ejemplos son:

  • marco zkML
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
MEVHunterLuckyvip
· hace1h
Otra ola ha llegado, realmente hay muchos que están especulando sobre el concepto de IA.
Ver originalesResponder0
ChainDetectivevip
· hace12h
¡Vamos a hacer dinero!!
Ver originalesResponder0
0xDreamChaservip
· hace12h
Cuando la IA se encuentra con Web3, realmente se pone emocionante.
Ver originalesResponder0
0xTherapistvip
· hace12h
Viene el trabajo, solo hay que hacerlo.
Ver originalesResponder0
DuskSurfervip
· hace12h
Otra vez es el ritmo de tomar a la gente por tonta.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)