Майбутнє Web3 AI полягає в стратегічному обході, зосередженні на прикордонних сценах та подоланні бар'єрів.

Майбутнє Web3 AI полягає в стратегічному обході

Акції Nvidia знову досягли рекордного рівня, прогрес мультимодальних моделей поглиблює технологічний бар'єр Web2 AI. Від семантичного вирівнювання до візуального розуміння, від високорозмірних вбудовувань до злиття ознак, складні моделі об'єднують різні модальності вираження з небаченою швидкістю, створюючи все більш закриту AI висоту. Ринок акцій США реагує позитивно, незалежно від того, чи це акції криптовалют, чи акції AI, всі демонструють невеликий бичачий ринок. Однак цей бум майже не пов'язаний із сферою криптовалют.

Нещодавно в Web3 AI є проблеми з напрямком спроб у напрямку агентів. Намагання зібрати модульну систему з багатьма модальностями у стилі Web2 за допомогою децентралізованої структури насправді є подвійним спотворенням технологій та мислення. У сьогоднішній реальності, де модулі сильно пов'язані, розподіл ознак нестабільний, а потреби в обчислювальних потужностях зосереджені, модульність з багатьма модальностями важко закріпитися в Web3. Майбутнє Web3 AI не в наслідуванні, а в стратегічному обході.

Web3 AI базується на спрощеній багатопроменевій моделі, семантична несумісність призводить до низької продуктивності

У сучасних багатомодальних системах Web2 AI "семантичне вирівнювання" означає відображення інформації з різних модальностей в одне семантичне простір, що дозволяє моделям розуміти та порівнювати значення цих сигналів. Лише досягнувши високодимензійного вбудованого простору, має сенс розбивати робочий процес на різні модулі. Але в протоколі Web3 Agent неможливо реалізувати високодимензійне вбудоване, оскільки модульність є помилкою Web3 AI.

Високорівневе вбудоване простір може вміщувати різноманітні, переплетені семантичні характеристики, дозволяючи їм займати більш чіткі позиції у своїх семантичних вимірах. Коли семантика не може бути вирівняна, різні сигнали в низькорівневому просторі "втискаються" один в одного, що призводить до зниження продуктивності моделі, ускладнює генерацію стратегій, важко захопити тонкі відмінності, а міжмодульна співпраця стає складною, система важко справляється зі складними ринковими сценаріями.

Web3 AI або протокол агентів важко реалізувати у високорозмірному вбудованому просторі. Більшість Web3 агентів просто упаковують готові API, бракує єдиного центрального вбудованого простору та механізму уваги між модулями. Вимога для Web3 AI реалізувати високорозмірний простір еквівалентна вимозі, щоб протокол агентів самостійно розробив всі відповідні API інтерфейси, що суперечить його модульній меті.

У низьковимірному просторі механізм уваги не може бути точно спроектований

Високоякісні мультимодальні моделі потребують точних механізмів уваги. Механізм уваги є способом динамічного розподілу обчислювальних ресурсів, що дозволяє моделі "зосереджуватися" на найрелевантніших частинах під час обробки вхідних даних певної модальності. Умовою ефективності механізму уваги є висока розмірність мультимодальних даних.

Web2 AI під час проектування механізму уваги спирається на основну ідею: під час обробки послідовностей модель динамічно розподіляє "ваги уваги" для кожного елемента, щоб зосередитися на найбільш релевантній інформації. Query-Key-Value — це механізм, що визначає ключову інформацію, що допомагає у пошуку необхідного контенту в просторових вимірах.

На основі модульного Web3 AI важко досягти єдиного планування уваги. Механізм уваги залежить від єдиного простору Query-Key-Value, тоді як незалежні API повертають дані у різних форматах і з різним розподілом, не здатні формувати інтерактивні Q/K/V. Багатоголова увага дозволяє одночасно паралельно фокусуватися на різних джерелах інформації, тоді як незалежні API часто є лінійними викликами, позбавленими паралельних і багатоканальних динамічних ваг.

Дискретний модульний підхід призводить до того, що злиття ознак залишається на поверхневому статичному з'єднанні

"Злиття ознак" є подальшим поєднанням векторів ознак, отриманих після обробки різних модальностей на основі вирівнювання та уваги. Web3 AI залишився на найпростішій стадії з'єднання, оскільки передумовою динамічного злиття ознак є високовимірний простір та точний механізм уваги.

Web2 AI схиляється до енд-ту-енд спільного навчання, одночасно обробляючи мультимодальні особливості в тому ж високорозмірному просторі, спільно оптимізуючи з шаром уваги та шаром злиття разом з шаром нижнього завдання. Web3 AI, навпаки, частіше використовує дискретну модульну збірку, що не має єдиної навчальної мети та міжмодульного градієнтного потоку.

Web2 AI відображає всі модальні ознаки у високорозмірному просторі, процес інтеграції включає кілька високих взаємодій. В агентів Web3 AI вихідні виміри дуже низькі, що ускладнює вираження складних крос-модальних зв'язків. Web2 AI формує замкнуту оптимізацію, тоді як Web3 AI часто покладається на ручну або зовнішню оцінку процесу налаштування, що призводить до відсутності автоматизованого зворотного зв'язку від початку до кінця.

Бар'єри в індустрії штучного інтелекту поглиблюються, але болючі точки ще не з'явилися

Багатомодальна система Web2 AI є величезним інженерним проектом, що потребує величезних обсягів даних, значних обчислювальних потужностей, сучасних технологій та складних інженерних рішень. Це створює потужні галузеві бар'єри та формує основну конкурентоспроможність провідних команд.

Web3 AI повинна застосувати тактику "села оточують місто" для розвитку, спочатку протестувавши на малих масштабах у крайових сценаріях, а потім, коли основа буде міцною, чекати на появу основних сценаріїв. Переваги Web3 AI полягають у децентралізації, високій паралельності, низькій зв'язаності та сумісності гетерогенних обчислювальних потужностей, що робить його придатним для легких структур, легких для паралелізації та завдань, що можуть бути стимульованими.

Поточні бар'єри Web2 AI лише починають формуватися, що є початковою стадією конкуренції провідних компаній. Можливості Web3 AI можуть з'явитися після зникнення переваг Web2 AI. До цього моменту проекти Web3 AI повинні обережно вибирати точки входу, зосереджуючись на можливості входу з периферійних сцен, на здатності постійно ітеративно розвиватися в малих застосункових сценах, а також на наявності достатньої гнучкості для реагування на зміни.

AGENT-1.83%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 9
  • Репост
  • Поділіться
Прокоментувати
0/400
NotFinancialAdvicevip
· 07-19 18:23
Можливості завжди на краю.
Переглянути оригіналвідповісти на0
MetaverseVagabondvip
· 07-18 00:14
Окружний шлях також є стратегією
Переглянути оригіналвідповісти на0
PretendingSeriousvip
· 07-17 05:53
Нова пляшка не принесе старе вино
Переглянути оригіналвідповісти на0
DataBartendervip
· 07-16 18:52
Деталі вирішують життя і смерть
Переглянути оригіналвідповісти на0
MEVHunterZhangvip
· 07-16 18:52
Багатомодальність зрештою буде подолана
Переглянути оригіналвідповісти на0
DancingCandlesvip
· 07-16 18:44
Централізоване чи все ж смачно
Переглянути оригіналвідповісти на0
NftDataDetectivevip
· 07-16 18:41
Тут бракує даних
Переглянути оригіналвідповісти на0
FlatlineTradervip
· 07-16 18:33
Обхід повинен мати межі.
Переглянути оригіналвідповісти на0
NFTArchaeologistvip
· 07-16 18:23
Ця хвиля призведе до великих втрат.
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріпити