La IA de Web3 tiene dificultades para superar las barreras de Web2 y necesita encontrar puntos de ruptura en escenarios marginales.

Los avances en la tecnología de IA de Web2 profundizan las barreras, Web3 IA debe buscar con cautela puntos de ruptura.

Las acciones de Nvidia alcanzan un nuevo máximo, y los avances en modelos multimodales han profundizado la barrera técnica del AI en Web2. Desde la alineación semántica hasta la comprensión visual, desde la incrustación de alta dimensión hasta la fusión de características, los modelos complejos están integrando diversas formas de expresión a una velocidad sin precedentes, construyendo una alta tierra de AI cada vez más cerrada. El mercado de valores de EE. UU. también ha respondido con acciones concretas, las acciones relacionadas con AI han experimentado una pequeña ola de mercado alcista.

Sin embargo, esta ola tiene casi ninguna relación con el campo de las criptomonedas. Los recientes intentos de Web3 AI, especialmente en la exploración de la dirección de Agentes, parecen tener un desvío: intentan ensamblar un sistema modular multimodal al estilo Web2 con estructuras descentralizadas, lo cual es en realidad una doble dislocación técnica y de pensamiento. En un contexto donde la acoplación de módulos es extremadamente fuerte, la distribución de características es altamente inestable y la demanda de poder de cálculo se concentra cada vez más, el modularismo multimodal tiene dificultades para establecerse en Web3.

El futuro de la IA en Web3 no radica en la imitación, sino en la estrategia de desviación. Desde la alineación semántica en espacios de alta dimensión, hasta el cuello de botella de información en mecanismos de atención, y la alineación de características bajo potencia de cálculo heterogénea, la IA en Web3 necesita encontrar nuevos caminos.

La alineación semántica efectiva en Web3 AI es difícil de lograr

En los sistemas multimodales de IA Web2 modernos, "alineación semántica" se refiere a mapear información de diferentes modalidades en el mismo espacio semántico, permitiendo que el modelo entienda y compare los significados subyacentes de estas señales originalmente diferentes en forma. Solo al lograr un espacio de incrustación de alta dimensión tiene sentido dividir el flujo de trabajo en diferentes módulos para reducir costos y aumentar la eficiencia.

Sin embargo, el protocolo Web3 Agent es difícil de implementar en incrustaciones de alta dimensión. La mayoría de los Web3 Agents simplemente encapsulan API listas para usar en módulos independientes, careciendo de un espacio de incrustación central unificado y de un mecanismo de atención entre módulos. Esto lleva a que la información no pueda interactuar desde múltiples ángulos y niveles entre los módulos, y solo pueda fluir de manera lineal, mostrando una única funcionalidad y sin poder formar una optimización de bucle cerrado en su conjunto.

Exigir que la inteligencia artificial Web3 realice un espacio de dimensiones elevadas es, en efecto, exigir que el protocolo Agent desarrolle por sí mismo todas las interfaces API involucradas, lo cual va en contra de su intención modular. Una arquitectura de alta dimensión requiere un entrenamiento unificado de extremo a extremo u optimización colaborativa, mientras que la idea de "módulo como complemento" del Agente Web3 agrava la fragmentación, lo que provoca un aumento en los costos de mantenimiento y limita el rendimiento general.

El espacio de baja dimensión limita el diseño preciso de los mecanismos de atención

Los modelos multimodales de alto nivel requieren el diseño de mecanismos de atención precisos. El mecanismo de atención es esencialmente una forma de asignar dinámicamente los recursos de cálculo, lo que permite que el modelo "se concentre" selectivamente en las partes más relevantes al procesar una entrada de cierta modalidad.

Sin embargo, es difícil lograr una programación de atención unificada en una Web3 AI basada en módulos. Primero, el mecanismo de atención depende de un espacio unificado de Query-Key-Value, mientras que los formatos de datos devueltos por las API independientes varían y no pueden formar un Q/K/V interactivo. En segundo lugar, la Web3 AI carece de la capacidad de ponderación dinámica en paralelo y multipunto, lo que impide simular la programación fina del mecanismo de atención que puntúa simultáneamente todas las posiciones o modalidades y luego las integra. Por último, los módulos de Web3 AI solo pueden ver el contexto "independiente" en el que son llamados, no hay un contexto central compartido en tiempo real entre ellos, lo que imposibilita la asociación y el enfoque global entre módulos.

La fusión de características se queda en la etapa superficial de la unión estática.

En la IA de Web2, la fusión de características se basa en la alineación y la atención, combinando vectores de características obtenidos de diferentes modalidades procesadas para su uso directo en tareas posteriores. Los métodos de fusión pueden variar desde simples concatenaciones y sumas ponderadas, hasta técnicas más complejas como la agrupación bilineal, la descomposición tensorial e incluso el enrutamiento dinámico.

Web3 AI utiliza más el enfoque de ensamblar módulos discretos, encapsulando varios tipos de API como agentes independientes, y luego simplemente combinando las etiquetas, valores o alarmas de umbral que cada uno de ellos genera, mediante decisiones integradas por la lógica principal o por humanos. Este enfoque carece de un objetivo de entrenamiento unificado y no tiene flujo de gradiente entre módulos.

La IA de Web2 mapea todas las características de los modos a un espacio de alta dimensión de miles de dimensiones, y el proceso de fusión incluye múltiples operaciones de interacción de alto nivel, capaces de captar asociaciones complejas y profundas entre modos. En comparación, las salidas de los agentes de la IA de Web3 a menudo solo contienen unos pocos campos o indicadores clave, con dimensiones de características extremadamente bajas, casi incapaces de expresar información compleja y sutil.

Las barreras en la industria de la IA se profundizan, Web3 AI debe buscar puntos de ruptura con cautela

El sistema multimodal de AI de Web2 es un proyecto de ingeniería extremadamente grande, que requiere grandes volúmenes de datos, potencia de cálculo, algoritmos avanzados y una implementación ingenieril compleja. Este trabajo sistemático y de pila completa en toda la cadena requiere altos estándares en términos de financiamiento, datos, potencia de cálculo, talento e incluso colaboración organizativa, lo que constituye una barrera de entrada muy fuerte en la industria.

Web3 AI necesita desarrollar con la táctica de "la zona rural rodeando la ciudad", probando a pequeña escala en escenarios periféricos, asegurando una base sólida antes de esperar la aparición de escenarios centrales. El núcleo de Web3 AI radica en la descentralización, y su trayectoria de evolución se manifiesta en alta paralelización, baja acoplamiento y compatibilidad de potencia de cálculo heterogénea. Esto hace que Web3 AI tenga más ventajas en escenarios como la computación en el borde, siendo adecuado para estructuras ligeras, tareas fácilmente paralelizables y motivadoras.

Sin embargo, las barreras actuales de la IA en Web2 apenas están comenzando a formarse, y esta es la etapa inicial de competencia entre las empresas líderes. La IA en Web3 necesita esperar a que se agoten los beneficios de la IA en Web2, dejando así las oportunidades para abordar los puntos críticos. Antes de eso, los proyectos de IA en Web3 deben discernir cuidadosamente si pueden entrar desde los márgenes, si pueden iterar y actualizar constantemente sus productos en pequeños escenarios, y si tienen la flexibilidad suficiente para adaptarse a las demandas del mercado en constante cambio. Solo al cumplir con estas condiciones, los proyectos de IA en Web3 tendrán la posibilidad de establecerse en el mercado futuro.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
down_only_larryvip
· 07-14 15:09
La integración de la IA en la cadena es demasiado difícil.
Ver originalesResponder0
LightningLadyvip
· 07-11 15:42
Potencia computacional no es un problema
Ver originalesResponder0
GmGmNoGnvip
· 07-11 15:41
El inversor minorista en el mundo Cripto también entiende de tecnología.
Ver originalesResponder0
CryptoComedianvip
· 07-11 15:26
tontos están minando en tierras extranjeras
Ver originalesResponder0
BlockchainDecodervip
· 07-11 15:19
Potencia computacional fragmentada
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)