Les avancées technologiques de l'IA Web2 renforcent les barrières, l'IA Web3 doit chercher prudemment des points de rupture.
Le prix de l'action Nvidia atteint un nouveau sommet, et les avancées des modèles multimodaux approfondissent les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'intégration de haute dimension à la fusion des caractéristiques, des modèles complexes intègrent des modalités d'expression à une vitesse sans précédent, construisant un bastion de l'IA de plus en plus fermé. Le marché boursier américain a également réagi par des actions concrètes, avec des actions liées à l'IA qui connaissent une petite tendance haussière.
Cependant, cet engouement n'a presque aucun lien avec le domaine des cryptomonnaies. Les récents essais de Web3 AI, en particulier l'exploration dans la direction des Agents, semblent déviés : ils tentent d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée, ce qui constitue en réalité un double décalage technique et de pensée. Dans un contexte où la couplage des modules est très fort, où la distribution des caractéristiques est hautement instable et où les besoins en puissance de calcul se concentrent de plus en plus, il est difficile pour le modulaire multimodal de trouver sa place dans Web3.
L'avenir de l'IA Web3 ne réside pas dans l'imitation, mais dans un détour stratégique. De l'alignement sémantique dans l'espace de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, jusqu'à l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit emprunter de nouvelles voies.
Web3 AI a du mal à réaliser un alignement sémantique efficace
Dans les systèmes multimodaux AI Web2 modernes, "l'alignement sémantique" fait référence à la cartographie des informations de différentes modalités dans un même espace sémantique, permettant au modèle de comprendre et de comparer les significations sous-jacentes de ces signaux initialement très différents. Ce n'est qu'en réalisant un espace d'insertion de haute dimension que diviser le flux de travail en différents modules a un sens en termes de réduction des coûts et d'augmentation de l'efficacité.
Cependant, le protocole Web3 Agent a du mal à réaliser des embeddings de haute dimension. La plupart des agents Web3 ne font que regrouper des API prêtes à l'emploi en modules indépendants, manquant d'un espace d'embedding centralisé unifié et d'un mécanisme d'attention inter-modules. Cela empêche l'information d'interagir sous plusieurs angles et niveaux entre les modules, ne pouvant suivre qu'un pipeline linéaire, affichant une fonctionnalité unique et incapable de former une optimisation fermée globale.
Exiger que l'IA Web3 réalise un espace de haute dimension revient à exiger que le protocole Agent développe lui-même toutes les interfaces API impliquées, ce qui va à l'encontre de son idée de modularité. Une architecture à haute dimension nécessite un entraînement unifié de bout en bout ou une optimisation collaborative, tandis que l'idée du "module comme plugin" de Web3 Agent aggrave la fragmentation, entraînant une augmentation des coûts de maintenance et limitant la performance globale.
L'espace à basse dimension limite la conception précise des mécanismes d'attention
Des modèles multimodaux de haut niveau nécessitent la conception de mécanismes d'attention précis. Le mécanisme d'attention est essentiellement une manière de répartir dynamiquement les ressources de calcul, permettant au modèle de "se concentrer" de manière sélective sur les parties les plus pertinentes lors du traitement d'une entrée de modalité.
Cependant, il est difficile de réaliser une planification d'attention unifiée avec l'IA Web3 basée sur des modules. Premièrement, le mécanisme d'attention dépend d'un espace de Query-Key-Value unifié, tandis que les formats et distributions des données retournées par les API indépendantes sont différents, ce qui empêche la formation de Q/K/V interactifs. Deuxièmement, l'IA Web3 manque de capacités de pondération dynamique parallèle et multi-chemins, ce qui l'empêche de simuler la planification fine dans le mécanisme d'attention qui évalue simultanément toutes les positions ou toutes les modalités, puis les intègre. Enfin, les modules d'IA Web3 ne peuvent voir que le contexte "indépendant" lorsqu'ils sont appelés, sans partage en temps réel d'un contexte central entre eux, ce qui empêche toute association et concentration globale entre les modules.
La fusion des caractéristiques reste à un stade de collage statique superficiel
Dans l'IA Web2, la fusion des caractéristiques consiste à combiner davantage les vecteurs de caractéristiques obtenus après traitement de différentes modalités, sur la base de l'alignement et de l'attention, pour une utilisation directe dans des tâches en aval. Les méthodes de fusion peuvent aller de la simple concaténation, de la somme pondérée, à des techniques plus complexes comme la pooling bilinéaire, la décomposition tensorielle, voire le routage dynamique.
Web3 AI adopte davantage une approche de montage de modules discrets, encapsulant divers API en agents indépendants, puis assemblant simplement les étiquettes, valeurs ou alertes seuils qu'ils produisent, pour une prise de décision intégrée par la logique principale ou par un humain. Cette méthode manque à la fois d'un objectif d'entraînement unifié et d'un flux de gradients entre les modules.
L'IA Web2 mappe toutes les caractéristiques de modalité dans un espace à haute dimension de milliers de dimensions, le processus de fusion impliquant diverses opérations d'interaction de haut niveau, capable de capturer des associations complexes et profondes entre les modalités. En revanche, les sorties des agents de l'IA Web3 contiennent souvent seulement quelques champs ou indicateurs clés, avec une dimension de caractéristiques extrêmement faible, presque incapable d'exprimer des informations complexes et subtiles.
Les barrières à l'entrée dans l'industrie de l'IA se renforcent, le Web3 IA doit rechercher prudemment des points de rupture.
Le système multimodal de l'IA Web2 est un projet d'ingénierie extrêmement vaste, nécessitant d'énormes quantités de données, une puissance de calcul importante, des algorithmes avancés et une mise en œuvre d'ingénierie complexe. Ce travail systémique, de bout en bout et à stack complète, impose des exigences très élevées en matière de financement, de données, de puissance de calcul, de talents et même de collaboration organisationnelle, formant ainsi des barrières d'entrée très fortes dans l'industrie.
Web3 AI doit se développer selon la tactique de "l'enveloppement des villes par les campagnes", en réalisant des tests à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides avant d'attendre l'émergence de scénarios centraux. Le cœur de Web3 AI réside dans la décentralisation, dont le chemin d'évolution se manifeste par une haute parallélisation, un faible couplage et la compatibilité des puissances de calcul hétérogènes. Cela confère à Web3 AI un avantage dans des scénarios tels que le calcul en périphérie, adapté aux structures légères, aux tâches facilement parallélisables et incitatives.
Cependant, les barrières actuelles de l'IA Web2 commencent à peine à se former, c'est une phase précoce de la concurrence entre les grandes entreprises. L'IA Web3 doit attendre que les avantages de l'IA Web2 disparaissent presque complètement, laissant des points de douleur, pour saisir l'opportunité d'entrer sur le marché. Avant cela, les projets d'IA Web3 doivent soigneusement déterminer s'ils peuvent entrer par les marges, s'ils peuvent itérer et mettre à jour leurs produits dans de petits scénarios, et s'ils ont suffisamment de flexibilité pour s'adapter à l'évolution des besoins du marché. Ce n'est qu'en remplissant ces conditions que les projets d'IA Web3 auront une chance de se faire une place sur le marché futur.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
21 J'aime
Récompense
21
5
Partager
Commentaire
0/400
down_only_larry
· 07-14 15:09
Il est trop difficile d'intégrer l'IA dans la chaîne.
Voir l'originalRépondre0
LightningLady
· 07-11 15:42
Puissance de calcul n'est pas un problème
Voir l'originalRépondre0
GmGmNoGn
· 07-11 15:41
L'investisseur détaillant de l'univers de la cryptomonnaie comprend également la technologie.
Voir l'originalRépondre0
CryptoComedian
· 07-11 15:26
Les pigeons minent dans un pays étranger.
Voir l'originalRépondre0
BlockchainDecoder
· 07-11 15:19
Problème de fragmentation de la puissance de calcul
Web3 AI a du mal à franchir les barrières de Web2 et doit trouver des points de rupture dans des scénarios marginaux.
Les avancées technologiques de l'IA Web2 renforcent les barrières, l'IA Web3 doit chercher prudemment des points de rupture.
Le prix de l'action Nvidia atteint un nouveau sommet, et les avancées des modèles multimodaux approfondissent les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'intégration de haute dimension à la fusion des caractéristiques, des modèles complexes intègrent des modalités d'expression à une vitesse sans précédent, construisant un bastion de l'IA de plus en plus fermé. Le marché boursier américain a également réagi par des actions concrètes, avec des actions liées à l'IA qui connaissent une petite tendance haussière.
Cependant, cet engouement n'a presque aucun lien avec le domaine des cryptomonnaies. Les récents essais de Web3 AI, en particulier l'exploration dans la direction des Agents, semblent déviés : ils tentent d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée, ce qui constitue en réalité un double décalage technique et de pensée. Dans un contexte où la couplage des modules est très fort, où la distribution des caractéristiques est hautement instable et où les besoins en puissance de calcul se concentrent de plus en plus, il est difficile pour le modulaire multimodal de trouver sa place dans Web3.
L'avenir de l'IA Web3 ne réside pas dans l'imitation, mais dans un détour stratégique. De l'alignement sémantique dans l'espace de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, jusqu'à l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit emprunter de nouvelles voies.
Web3 AI a du mal à réaliser un alignement sémantique efficace
Dans les systèmes multimodaux AI Web2 modernes, "l'alignement sémantique" fait référence à la cartographie des informations de différentes modalités dans un même espace sémantique, permettant au modèle de comprendre et de comparer les significations sous-jacentes de ces signaux initialement très différents. Ce n'est qu'en réalisant un espace d'insertion de haute dimension que diviser le flux de travail en différents modules a un sens en termes de réduction des coûts et d'augmentation de l'efficacité.
Cependant, le protocole Web3 Agent a du mal à réaliser des embeddings de haute dimension. La plupart des agents Web3 ne font que regrouper des API prêtes à l'emploi en modules indépendants, manquant d'un espace d'embedding centralisé unifié et d'un mécanisme d'attention inter-modules. Cela empêche l'information d'interagir sous plusieurs angles et niveaux entre les modules, ne pouvant suivre qu'un pipeline linéaire, affichant une fonctionnalité unique et incapable de former une optimisation fermée globale.
Exiger que l'IA Web3 réalise un espace de haute dimension revient à exiger que le protocole Agent développe lui-même toutes les interfaces API impliquées, ce qui va à l'encontre de son idée de modularité. Une architecture à haute dimension nécessite un entraînement unifié de bout en bout ou une optimisation collaborative, tandis que l'idée du "module comme plugin" de Web3 Agent aggrave la fragmentation, entraînant une augmentation des coûts de maintenance et limitant la performance globale.
L'espace à basse dimension limite la conception précise des mécanismes d'attention
Des modèles multimodaux de haut niveau nécessitent la conception de mécanismes d'attention précis. Le mécanisme d'attention est essentiellement une manière de répartir dynamiquement les ressources de calcul, permettant au modèle de "se concentrer" de manière sélective sur les parties les plus pertinentes lors du traitement d'une entrée de modalité.
Cependant, il est difficile de réaliser une planification d'attention unifiée avec l'IA Web3 basée sur des modules. Premièrement, le mécanisme d'attention dépend d'un espace de Query-Key-Value unifié, tandis que les formats et distributions des données retournées par les API indépendantes sont différents, ce qui empêche la formation de Q/K/V interactifs. Deuxièmement, l'IA Web3 manque de capacités de pondération dynamique parallèle et multi-chemins, ce qui l'empêche de simuler la planification fine dans le mécanisme d'attention qui évalue simultanément toutes les positions ou toutes les modalités, puis les intègre. Enfin, les modules d'IA Web3 ne peuvent voir que le contexte "indépendant" lorsqu'ils sont appelés, sans partage en temps réel d'un contexte central entre eux, ce qui empêche toute association et concentration globale entre les modules.
La fusion des caractéristiques reste à un stade de collage statique superficiel
Dans l'IA Web2, la fusion des caractéristiques consiste à combiner davantage les vecteurs de caractéristiques obtenus après traitement de différentes modalités, sur la base de l'alignement et de l'attention, pour une utilisation directe dans des tâches en aval. Les méthodes de fusion peuvent aller de la simple concaténation, de la somme pondérée, à des techniques plus complexes comme la pooling bilinéaire, la décomposition tensorielle, voire le routage dynamique.
Web3 AI adopte davantage une approche de montage de modules discrets, encapsulant divers API en agents indépendants, puis assemblant simplement les étiquettes, valeurs ou alertes seuils qu'ils produisent, pour une prise de décision intégrée par la logique principale ou par un humain. Cette méthode manque à la fois d'un objectif d'entraînement unifié et d'un flux de gradients entre les modules.
L'IA Web2 mappe toutes les caractéristiques de modalité dans un espace à haute dimension de milliers de dimensions, le processus de fusion impliquant diverses opérations d'interaction de haut niveau, capable de capturer des associations complexes et profondes entre les modalités. En revanche, les sorties des agents de l'IA Web3 contiennent souvent seulement quelques champs ou indicateurs clés, avec une dimension de caractéristiques extrêmement faible, presque incapable d'exprimer des informations complexes et subtiles.
Les barrières à l'entrée dans l'industrie de l'IA se renforcent, le Web3 IA doit rechercher prudemment des points de rupture.
Le système multimodal de l'IA Web2 est un projet d'ingénierie extrêmement vaste, nécessitant d'énormes quantités de données, une puissance de calcul importante, des algorithmes avancés et une mise en œuvre d'ingénierie complexe. Ce travail systémique, de bout en bout et à stack complète, impose des exigences très élevées en matière de financement, de données, de puissance de calcul, de talents et même de collaboration organisationnelle, formant ainsi des barrières d'entrée très fortes dans l'industrie.
Web3 AI doit se développer selon la tactique de "l'enveloppement des villes par les campagnes", en réalisant des tests à petite échelle dans des scénarios périphériques, en s'assurant que les bases sont solides avant d'attendre l'émergence de scénarios centraux. Le cœur de Web3 AI réside dans la décentralisation, dont le chemin d'évolution se manifeste par une haute parallélisation, un faible couplage et la compatibilité des puissances de calcul hétérogènes. Cela confère à Web3 AI un avantage dans des scénarios tels que le calcul en périphérie, adapté aux structures légères, aux tâches facilement parallélisables et incitatives.
Cependant, les barrières actuelles de l'IA Web2 commencent à peine à se former, c'est une phase précoce de la concurrence entre les grandes entreprises. L'IA Web3 doit attendre que les avantages de l'IA Web2 disparaissent presque complètement, laissant des points de douleur, pour saisir l'opportunité d'entrer sur le marché. Avant cela, les projets d'IA Web3 doivent soigneusement déterminer s'ils peuvent entrer par les marges, s'ils peuvent itérer et mettre à jour leurs produits dans de petits scénarios, et s'ils ont suffisamment de flexibilité pour s'adapter à l'évolution des besoins du marché. Ce n'est qu'en remplissant ces conditions que les projets d'IA Web3 auront une chance de se faire une place sur le marché futur.