El futuro de Web3 AI radica en la estrategia de rodeo, centrando la atención en escenarios marginales para romper barreras.

El futuro de Web3 AI radica en la estrategia y la evasión.

Las acciones de Nvidia alcanzan un nuevo máximo histórico, y los avances en modelos multimodales profundizan la barrera tecnológica de la IA en Web2. Desde la alineación semántica hasta la comprensión visual, desde incrustaciones de alta dimensión hasta la fusión de características, los modelos complejos están integrando diversas formas de expresión a una velocidad sin precedentes, construyendo una alta tierra de IA cada vez más cerrada. El mercado de valores estadounidense reacciona positivamente, tanto las acciones de criptomonedas como las de IA muestran un pequeño mercado alcista. Sin embargo, esta ola de entusiasmo está casi sin relación con el campo de las criptomonedas.

Recientemente, la dirección de los intentos de Web3 AI en el área de Agentes presenta problemas de dirección. Intentar ensamblar un sistema modular multimodal al estilo Web2 con una estructura descentralizada es, en realidad, una doble descoordinación técnica y de pensamiento. En un contexto donde la acoplabilidad de los módulos es fuerte, la distribución de características es inestable y la demanda de potencia de cálculo es centralizada, es difícil que la modularidad multimodal tenga un lugar en Web3. El futuro de Web3 AI no está en la imitación, sino en la evasión estratégica.

Web3 AI basado en modelos multimodales aplanados, la falta de alineación semántica conduce a un bajo rendimiento

En los sistemas multimodales de la IA Web2 moderna, "alineación semántica" se refiere a mapear la información de diferentes modalidades en un mismo espacio semántico, permitiendo que el modelo entienda y compare los significados detrás de estas señales. Solo tiene sentido lograr un espacio de incrustación de alta dimensión dividiendo el flujo de trabajo en diferentes módulos. Pero en el protocolo Web3 Agent, no es posible lograr incrustaciones de alta dimensión, ya que la modularidad es un error de la IA Web3.

El espacio de incrustación de alta dimensión puede acomodar características semánticas diversas y entrelazadas, permitiendo que tengan una posición más clara en sus respectivas dimensiones semánticas. Cuando la semántica no puede alinearse, diferentes señales en un espacio de baja dimensión "se comprimen" entre sí, lo que lleva a una disminución del rendimiento del modelo, dificultando la generación de estrategias para captar diferencias sutiles, y complicando la colaboración entre módulos, lo que dificulta que el sistema maneje escenarios de mercado complejos.

El protocolo Web3 AI o Agent es difícil de implementar en un espacio de incrustación de alta dimensión. La mayoría de los agentes Web3 son simplemente envolturas de API existentes, careciendo de un espacio de incrustación central unificado y un mecanismo de atención entre módulos. Exigir que Web3 AI implemente un espacio de alta dimensión equivale a exigir que el protocolo Agent desarrolle por sí mismo todas las interfaces de API involucradas, lo que va en contra de su intención modular.

En espacios de baja dimensión, el mecanismo de atención no puede ser diseñado con precisión.

Los modelos multimodales de alto nivel requieren mecanismos de atención precisos. El mecanismo de atención es una forma de asignar dinámicamente recursos computacionales, permitiendo que el modelo "se concentre" selectivamente en las partes más relevantes al procesar una entrada de una determinada modalidad. La condición para que el mecanismo de atención funcione es que los multimodales tengan alta dimensionalidad.

La IA de Web2 al diseñar mecanismos de atención, la idea central es que al procesar secuencias, el modelo asigna dinámicamente "pesos de atención" a cada elemento, permitiendo que se centre en la información más relevante. Query-Key-Value es el mecanismo para determinar la información clave, ayudando a recuperar el contenido necesario en el espacio de dimensiones.

La programación de atención unificada es difícil de lograr en Web3 AI basada en módulos. El mecanismo de atención depende de un espacio uniforme de Query-Key-Value, mientras que las API independientes devuelven datos en diferentes formatos y distribuciones, lo que impide la formación de Q/K/V interactivos. La atención multi-cabeza permite centrarse en diferentes fuentes de información de manera paralela, mientras que las API independientes a menudo son llamadas lineales, careciendo de capacidades de ponderación dinámica paralela y múltiple.

La modularidad discontinua en el ensamblaje provoca que la fusión de características se quede en una unión estática superficial.

"Fusión de características" es la combinación adicional de vectores de características obtenidos tras procesar diferentes modalidades, basada en alineación y atención. La inteligencia artificial Web3 se encuentra en la etapa más simple de concatenación, ya que la fusión dinámica de características requiere un espacio de alta dimensión y un mecanismo de atención preciso.

La IA de Web2 tiende a un entrenamiento conjunto de extremo a extremo, procesando simultáneamente características multimodales en el mismo espacio de alta dimensión, optimizando de manera colaborativa con las capas de atención y fusión junto con la capa de tareas posteriores. La IA de Web3, en cambio, utiliza en su mayoría la concatenación de módulos discretos, careciendo de un objetivo de entrenamiento unificado y de un flujo de gradientes entre módulos.

La IA de Web2 mapea todas las características de los modos a un espacio de alta dimensión, y el proceso de fusión incluye múltiples operaciones de interacción de orden superior. La salida de los agentes de la IA de Web3 tiene dimensiones extremadamente bajas, lo que dificulta la expresión de asociaciones complejas entre modos. La IA de Web2 forma una optimización en bucle cerrado, mientras que la IA de Web3 depende en gran medida de procesos de evaluación y ajuste de parámetros manuales o externos, careciendo de retroalimentación automatizada de extremo a extremo.

Las barreras de entrada en la industria de la IA se profundizan, pero aún no han surgido los puntos de dolor.

Los sistemas multimodales de IA Web2 son grandes proyectos de ingeniería que requieren grandes volúmenes de datos, mucha potencia de cálculo, tecnología avanzada y una implementación técnica compleja. Esto constituye una fuerte barrera de entrada al sector y también crea la ventaja competitiva central de los equipos líderes.

Web3 AI debería adoptar la táctica de "la agricultura rodea la ciudad" para desarrollarse, probando en pequeñas escalas en escenarios periféricos y esperando a que aparezcan los escenarios centrales una vez que la base esté sólida. La ventaja de Web3 AI radica en la descentralización, alta paralelización, bajo acoplamiento y compatibilidad con potencia de cálculo heterogénea, lo que lo hace adecuado para estructuras ligeras, tareas fácilmente paralelizables y que pueden incentivarse.

La barrera del Web2 AI acaba de comenzar a formarse, siendo esta la etapa temprana de la competencia entre las empresas líderes. La oportunidad del Web3 AI podría surgir después de que desaparezcan los beneficios del Web2 AI. Antes de esto, los proyectos de Web3 AI deben elegir con cuidado sus puntos de entrada, prestando atención a si pueden entrar en escenarios marginales, si pueden iterar continuamente en pequeños escenarios de aplicación y si tienen suficiente flexibilidad para adaptarse a los cambios.

AGENT-6.26%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • Republicar
  • Compartir
Comentar
0/400
NotFinancialAdvicevip
· 07-19 18:23
Las oportunidades siempre están en los márgenes.
Ver originalesResponder0
MetaverseVagabondvip
· 07-18 00:14
El rodeo también es una estrategia
Ver originalesResponder0
PretendingSeriousvip
· 07-17 05:53
No se puede poner vino viejo en una botella nueva.
Ver originalesResponder0
DataBartendervip
· 07-16 18:52
Los detalles deciden la vida y la muerte
Ver originalesResponder0
MEVHunterZhangvip
· 07-16 18:52
La multimodalidad eventualmente será rompible.
Ver originalesResponder0
DancingCandlesvip
· 07-16 18:44
¿Centralizado o realmente delicioso?
Ver originalesResponder0
NftDataDetectivevip
· 07-16 18:41
Faltan puntos de datos aquí
Ver originalesResponder0
FlatlineTradervip
· 07-16 18:33
La evasión también debe tener límites.
Ver originalesResponder0
NFTArchaeologistvip
· 07-16 18:23
Esta ola va a perder mucho.
Ver originalesResponder0
Ver más
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)