L'avenir de l'IA Web3 réside dans une approche stratégique en contournant les obstacles, en se concentrant sur des scénarios de périphérie.

L'avenir de l'IA Web3 réside dans des détours stratégiques

Le prix des actions d'NVIDIA atteint de nouveaux sommets, et les avancées des modèles multimodaux approfondissent les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'incorporation de haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse sans précédent diverses modalités d'expression, construisant un bastion de l'IA de plus en plus fermé. Le marché boursier américain réagit positivement, que ce soit pour les actions de crypto-monnaies ou d'IA, un petit marché haussier se dessine. Cependant, cet engouement n'a presque aucun lien avec le domaine des crypto-monnaies.

Récemment, les tentatives de Web3 AI dans la direction des agents présentent des problèmes de direction. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée est en réalité un double décalage technique et de pensée. Aujourd'hui, avec une forte couplage des modules, une distribution des caractéristiques instable et une demande de puissance de calcul centralisée, le modulaire multimodal a du mal à s'établir dans Web3. L'avenir de Web3 AI ne réside pas dans l'imitation, mais dans une déviation stratégique.

Web3 AI basé sur un modèle multimodal aplati, l'alignement sémantique non réussi entraîne de faibles performances

Dans les systèmes multimodaux de l'IA Web2 moderne, "l'alignement sémantique" fait référence à la cartographie des informations de différentes modalités dans un même espace sémantique, permettant au modèle de comprendre et de comparer les significations derrière ces signaux. Il n'est significatif de diviser le flux de travail en différents modules que lorsque l'espace d'incorporation en haute dimension est réalisé. Cependant, dans le protocole Web3 Agent, il n'est pas possible de réaliser une haute dimension d'incorporation, car la modularité est une erreur de l'IA Web3.

L'espace d'embedding de haute dimension peut accueillir des caractéristiques sémantiques variées et imbriquées, leur permettant d'avoir une position plus claire dans leurs dimensions sémantiques respectives. Lorsque les sémantiques ne peuvent pas s'aligner, différents signaux dans un espace de faible dimension se "comressent" les uns contre les autres, ce qui entraîne une diminution des performances du modèle, rendant difficile la capture des subtilités dans la génération de stratégies, rendant la collaboration entre modules difficile, et rendant le système incapable de faire face à des scénarios de marché complexes.

Le protocole Web3 AI ou Agent a du mal à réaliser un espace d'insertion de haute dimension. La plupart des agents Web3 ne font que encapsuler des API existantes, manquant d'un espace d'insertion centralisé unifié et d'un mécanisme d'attention inter-modules. Exiger que l'IA Web3 réalise un espace de haute dimension équivaut à demander au protocole Agent de développer lui-même toutes les interfaces API concernées, ce qui va à l'encontre de son intention modulaire.

Dans un espace de faible dimension, le mécanisme d'attention ne peut pas être conçu avec précision.

Des modèles multimodaux de haut niveau nécessitent des mécanismes d'attention précis. Les mécanismes d'attention sont une manière de répartir dynamiquement les ressources de calcul, permettant au modèle de "se concentrer" sélectivement sur les parties les plus pertinentes lors du traitement d'une entrée d'une certaine modalité. Le fonctionnement des mécanismes d'attention repose sur le fait que les multimodaux possèdent une haute dimension.

L'IA Web2, lors de la conception des mécanismes d'attention, a pour idée principale de répartir dynamiquement des "poids d'attention" à chaque élément lors du traitement des séquences, afin de se concentrer sur les informations les plus pertinentes. Le mécanisme Query-Key-Value permet de déterminer les informations clés et aide à récupérer le contenu souhaité dans l'espace dimensionnel.

La planification de l'attention unifiée est difficile à réaliser pour l'IA Web3 basée sur des modules. Le mécanisme d'attention repose sur un espace Query-Key-Value unifié, tandis que les API indépendantes renvoient des données de formats et de distributions différents, ce qui empêche la formation d'un Q/K/V interactif. L'attention multi-tête permet de se concentrer simultanément sur différentes sources d'information, tandis que les API indépendantes sont souvent appelées de manière linéaire, manquant de capacités de mise en parallèle et de pondération dynamique multi-voies.

La modularité discrète des assemblages entraîne une fusion des caractéristiques qui reste à une ébauche statique superficielle.

"Fusion de caractéristiques" consiste à combiner davantage les vecteurs de caractéristiques obtenus après le traitement de différentes modalités, sur la base de l'alignement et de l'attention. L'IA Web3 en est encore au stade de la simple concaténation, car la fusion dynamique des caractéristiques repose sur un espace de haute dimension et un mécanisme d'attention précis.

L'IA Web2 a tendance à un entraînement conjoint de bout en bout, traitant simultanément des caractéristiques multimodales dans le même espace de haute dimension, en optimisant de manière collaborative avec les couches d'attention et de fusion ainsi que la couche de tâche en aval. L'IA Web3, en revanche, utilise souvent des modules discrets juxtaposés, manquant d'un objectif d'entraînement unifié et d'un flux de gradient inter-modules.

L'IA Web2 mappe toutes les caractéristiques des modalités dans un espace de haute dimension, le processus de fusion comprend diverses opérations d'interaction de haut niveau. Les dimensions de sortie des différents agents de l'IA Web3 sont très faibles, rendant difficile l'expression de relations complexes entre les modalités. L'IA Web2 forme une optimisation en boucle fermée, tandis que l'IA Web3 dépend beaucoup de l'évaluation des paramètres par des processus manuels ou externes, manquant d'un retour d'information automatisé de bout en bout.

Les barrières à l'entrée de l'industrie de l'IA se renforcent, mais les points de douleur ne sont pas encore apparus

Les systèmes multimodaux de l'IA Web2 sont de vastes projets d'ingénierie nécessitant d'énormes quantités de données, une grande puissance de calcul, des technologies avancées et des réalisations d'ingénierie complexes. Cela constitue de puissantes barrières à l'entrée dans le secteur et crée le cœur de la compétitivité des équipes leaders.

L'IA Web3 devrait adopter la tactique de "l'encerclement des villes par les campagnes" pour se développer, en testant à petite échelle dans des scénarios périphériques, puis en attendant l'émergence de scénarios centraux une fois que les bases sont solides. Les avantages de l'IA Web3 résident dans la décentralisation, le haut parallélisme, le faible couplage et la compatibilité avec des puissances de calcul hétérogènes, ce qui la rend adaptée à des structures légères, des tâches facilement parallélisables et incitatives.

Les barrières de l'IA Web2 commencent tout juste à se former, et nous sommes à un stade précoce de la concurrence entre les grandes entreprises. Les opportunités de l'IA Web3 pourraient apparaître après la disparition des dividendes de l'IA Web2. Avant cela, les projets d'IA Web3 doivent choisir avec prudence leur point d'entrée, en se concentrant sur leur capacité à pénétrer des scénarios périphériques, à itérer constamment dans de petits scénarios d'application et à disposer d'une flexibilité suffisante pour faire face aux changements.

AGENT-5.43%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 9
  • Reposter
  • Partager
Commentaire
0/400
NotFinancialAdvicevip
· 07-19 18:23
Les opportunités se trouvent toujours à la périphérie.
Voir l'originalRépondre0
MetaverseVagabondvip
· 07-18 00:14
L'évitement est aussi une stratégie.
Voir l'originalRépondre0
PretendingSeriousvip
· 07-17 05:53
Une nouvelle bouteille ne peut pas contenir du vieux vin.
Voir l'originalRépondre0
DataBartendervip
· 07-16 18:52
Les détails décident de la vie ou de la mort
Voir l'originalRépondre0
MEVHunterZhangvip
· 07-16 18:52
La multimodalité finira par être brisée.
Voir l'originalRépondre0
DancingCandlesvip
· 07-16 18:44
Centralisé ou pas, c'est vraiment bon.
Voir l'originalRépondre0
NftDataDetectivevip
· 07-16 18:41
Données manquantes ici
Voir l'originalRépondre0
FlatlineTradervip
· 07-16 18:33
Les détours doivent avoir des limites.
Voir l'originalRépondre0
NFTArchaeologistvip
· 07-16 18:23
Cette vague va coûter cher.
Voir l'originalRépondre0
Afficher plus
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)