Sự tiến bộ của công nghệ AI Web2 làm sâu sắc thêm rào cản, AI Web3 cần thận trọng tìm kiếm lối thoát
Cổ phiếu của Nvidia đạt mức cao kỷ lục mới, sự tiến bộ của các mô hình đa phương thức đã làm sâu sắc thêm rào cản công nghệ của Web2 AI. Từ sự đồng nhất ngữ nghĩa đến hiểu biết thị giác, từ nhúng nhiều chiều đến hợp nhất đặc trưng, các mô hình phức tạp đang tích hợp các cách diễn đạt của nhiều phương thức với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín. Thị trường chứng khoán Mỹ cũng đã phản ứng bằng hành động thực tế, các cổ phiếu liên quan đến AI đã có một đợt tăng giá nhỏ.
Tuy nhiên, làn sóng này hầu như không liên quan gì đến lĩnh vực tiền điện tử. Những nỗ lực gần đây trong Web3 AI, đặc biệt là trong hướng nghiên cứu Agent, dường như có sự lệch lạc về phương hướng: cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung, thực tế là một sự sai lệch kép về công nghệ và tư duy. Trong bối cảnh tính liên kết của các mô-đun cực kỳ mạnh, sự phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, mô-đun đa phương thức khó có thể đứng vững trong Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước, mà ở sự đi vòng chiến lược. Từ việc đồng bộ ngữ nghĩa trong không gian chiều cao, đến nút thắt thông tin trong cơ chế chú ý, và đến việc đồng bộ đặc trưng dưới sức mạnh tính toán dị thể, Web3 AI cần tìm ra con đường mới.
Web3 AI khó khăn trong việc đạt được sự căn chỉnh ngữ nghĩa hiệu quả
Trong hệ thống AI đa mô thức Web2 hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các mô thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh những tín hiệu vốn có hình thức khác nhau nhưng có ý nghĩa nội tại giống nhau. Chỉ khi đạt được không gian nhúng đa chiều, việc chia tách quy trình làm việc thành các mô-đun khác nhau mới có ý nghĩa trong việc giảm chi phí và tăng hiệu quả.
Tuy nhiên, giao thức Web3 Agent khó có thể thực hiện nhúng không gian đa chiều. Hầu hết các Web3 Agent chỉ đơn giản là đóng gói các API có sẵn thành các mô-đun độc lập, thiếu không gian nhúng trung tâm thống nhất và cơ chế chú ý xuyên mô-đun. Điều này dẫn đến việc thông tin không thể tương tác giữa các mô-đun theo nhiều góc độ và nhiều cấp độ, chỉ có thể đi theo quy trình tuyến tính, thể hiện một chức năng duy nhất, không thể hình thành tối ưu hóa vòng khép kín tổng thể.
Yêu cầu Web3 AI hiện thực hóa không gian cao chiều, tương đương với việc yêu cầu giao thức Agent tự phát triển tất cả các giao diện API liên quan, điều này đi ngược lại với mục đích mô-đun của nó. Kiến trúc độ cao yêu cầu đào tạo thống nhất hoặc tối ưu hóa hợp tác từ đầu đến cuối, trong khi tư duy "mô-đun là plugin" của Web3 Agent lại làm trầm trọng thêm sự phân mảnh, dẫn đến chi phí bảo trì tăng vọt và hiệu suất tổng thể bị hạn chế.
Không gian bậc thấp hạn chế thiết kế tinh vi của cơ chế chú ý
Mô hình đa mô thức ở cấp độ cao cần thiết kế các cơ chế chú ý tinh vi. Cơ chế chú ý về bản chất là một cách phân bổ tài nguyên tính toán một cách động, cho phép mô hình "tập trung" chọn lọc vào những phần liên quan nhất khi xử lý đầu vào của một mô thức.
Tuy nhiên, Web3 AI dựa trên mô-đun khó có thể thực hiện phân bổ chú ý thống nhất. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi định dạng và phân bố dữ liệu trả về từ các API độc lập khác nhau, không thể tạo nên Q/K/V có thể tương tác. Thứ hai, Web3 AI thiếu khả năng phân bổ động đa tuyến theo cách song song, không thể mô phỏng sự phân bổ tinh vi trong cơ chế chú ý, nơi tất cả các vị trí hoặc tất cả các mô hình đều được chấm điểm đồng thời, sau đó tổng hợp lại. Cuối cùng, các mô-đun Web3 AI chỉ có thể thấy "bối cảnh độc lập" của chính mình khi được gọi, giữa chúng không có bối cảnh trung tâm nào được chia sẻ theo thời gian thực, do đó không thể thực hiện liên kết và tập trung toàn cầu giữa các mô-đun.
Tính năng kết hợp vẫn dừng lại ở giai đoạn ghép tĩnh đơn giản
Trong Web2 AI, việc kết hợp đặc trưng là quá trình kết hợp các vectơ đặc trưng thu được từ các mô hình khác nhau sau khi xử lý, dựa trên đồng bộ hóa và chú ý, để phục vụ cho các nhiệm vụ hạ nguồn. Các phương pháp kết hợp có thể từ đơn giản như nối, tổng trọng số, đến phức tạp hơn như pooling song tuyến tính, phân tích tensor thậm chí là công nghệ định tuyến động.
Web3 AI thì thường sử dụng phương pháp ghép các mô-đun rời rạc, đóng gói các loại API thành các Agent độc lập, sau đó đơn giản ghép nối các nhãn, giá trị hoặc báo động ngưỡng mà chúng xuất ra, để đưa ra quyết định tổng hợp qua logic chính hoặc con người. Cách này vừa thiếu mục tiêu đào tạo thống nhất, vừa không có dòng chảy gradient giữa các mô-đun.
Web2 AI ánh xạ tất cả các đặc trưng của các mô hình vào không gian cao chiều hàng ngàn chiều, quá trình tích hợp bao gồm nhiều thao tác tương tác bậc cao, có khả năng nắm bắt các mối quan hệ liên mô hình sâu sắc và phức tạp. Ngược lại, các đầu ra của các tác nhân Web3 AI thường chỉ chứa vài trường hoặc chỉ số chính, với chiều đặc trưng cực thấp, gần như không thể diễn đạt thông tin tinh vi phức tạp.
Rào cản trong ngành AI ngày càng sâu sắc, Web3 AI cần thận trọng trong việc tìm kiếm lối thoát
Hệ thống đa mô thức AI Web2 là một dự án kỹ thuật cực kỳ lớn, cần một khối lượng dữ liệu khổng lồ, sức mạnh tính toán mạnh mẽ, thuật toán tiên tiến và thực hiện kỹ thuật phức tạp. Công việc hệ thống toàn chuỗi, toàn ngăn này yêu cầu rất cao về tài chính, dữ liệu, sức mạnh tính toán, nhân tài và thậm chí là sự phối hợp tổ chức, tạo thành một rào cản ngành nghề rất mạnh.
Web3 AI cần phát triển theo chiến thuật "nông thôn bao vây thành phố", thử nghiệm quy mô nhỏ ở các tình huống biên, đảm bảo nền tảng vững chắc trước khi chờ đợi sự xuất hiện của các tình huống cốt lõi. Cốt lõi của Web3 AI nằm ở tính phi tập trung, và con đường tiến hóa của nó thể hiện bằng khả năng song song cao, độ kết hợp thấp và tính tương thích của sức mạnh tính toán dị thể. Điều này khiến Web3 AI có lợi thế hơn trong các tình huống như tính toán biên, phù hợp với cấu trúc nhẹ, dễ song song và có thể khuyến khích các nhiệm vụ.
Tuy nhiên, rào cản của Web2 AI hiện tại chỉ mới bắt đầu hình thành, đây là giai đoạn đầu của cuộc cạnh tranh giữa các doanh nghiệp hàng đầu. Web3 AI cần chờ đợi cho đến khi lợi ích của Web2 AI gần như biến mất, để lại những điểm đau mới là cơ hội để tham gia. Trước khi điều đó xảy ra, các dự án Web3 AI cần cẩn thận xác định xem có thể tham gia từ bên lề hay không, có thể liên tục cập nhật sản phẩm trong các tình huống nhỏ hay không, và có đủ linh hoạt để thích ứng với nhu cầu thị trường đang thay đổi hay không. Chỉ khi đáp ứng những điều kiện này, các dự án Web3 AI mới có khả năng đứng vững trong thị trường tương lai.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Web3 AI khó có thể vượt qua rào cản của Web2, cần tìm ra điểm đột phá ở các tình huống biên.
Sự tiến bộ của công nghệ AI Web2 làm sâu sắc thêm rào cản, AI Web3 cần thận trọng tìm kiếm lối thoát
Cổ phiếu của Nvidia đạt mức cao kỷ lục mới, sự tiến bộ của các mô hình đa phương thức đã làm sâu sắc thêm rào cản công nghệ của Web2 AI. Từ sự đồng nhất ngữ nghĩa đến hiểu biết thị giác, từ nhúng nhiều chiều đến hợp nhất đặc trưng, các mô hình phức tạp đang tích hợp các cách diễn đạt của nhiều phương thức với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín. Thị trường chứng khoán Mỹ cũng đã phản ứng bằng hành động thực tế, các cổ phiếu liên quan đến AI đã có một đợt tăng giá nhỏ.
Tuy nhiên, làn sóng này hầu như không liên quan gì đến lĩnh vực tiền điện tử. Những nỗ lực gần đây trong Web3 AI, đặc biệt là trong hướng nghiên cứu Agent, dường như có sự lệch lạc về phương hướng: cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung, thực tế là một sự sai lệch kép về công nghệ và tư duy. Trong bối cảnh tính liên kết của các mô-đun cực kỳ mạnh, sự phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, mô-đun đa phương thức khó có thể đứng vững trong Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước, mà ở sự đi vòng chiến lược. Từ việc đồng bộ ngữ nghĩa trong không gian chiều cao, đến nút thắt thông tin trong cơ chế chú ý, và đến việc đồng bộ đặc trưng dưới sức mạnh tính toán dị thể, Web3 AI cần tìm ra con đường mới.
Web3 AI khó khăn trong việc đạt được sự căn chỉnh ngữ nghĩa hiệu quả
Trong hệ thống AI đa mô thức Web2 hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các mô thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh những tín hiệu vốn có hình thức khác nhau nhưng có ý nghĩa nội tại giống nhau. Chỉ khi đạt được không gian nhúng đa chiều, việc chia tách quy trình làm việc thành các mô-đun khác nhau mới có ý nghĩa trong việc giảm chi phí và tăng hiệu quả.
Tuy nhiên, giao thức Web3 Agent khó có thể thực hiện nhúng không gian đa chiều. Hầu hết các Web3 Agent chỉ đơn giản là đóng gói các API có sẵn thành các mô-đun độc lập, thiếu không gian nhúng trung tâm thống nhất và cơ chế chú ý xuyên mô-đun. Điều này dẫn đến việc thông tin không thể tương tác giữa các mô-đun theo nhiều góc độ và nhiều cấp độ, chỉ có thể đi theo quy trình tuyến tính, thể hiện một chức năng duy nhất, không thể hình thành tối ưu hóa vòng khép kín tổng thể.
Yêu cầu Web3 AI hiện thực hóa không gian cao chiều, tương đương với việc yêu cầu giao thức Agent tự phát triển tất cả các giao diện API liên quan, điều này đi ngược lại với mục đích mô-đun của nó. Kiến trúc độ cao yêu cầu đào tạo thống nhất hoặc tối ưu hóa hợp tác từ đầu đến cuối, trong khi tư duy "mô-đun là plugin" của Web3 Agent lại làm trầm trọng thêm sự phân mảnh, dẫn đến chi phí bảo trì tăng vọt và hiệu suất tổng thể bị hạn chế.
Không gian bậc thấp hạn chế thiết kế tinh vi của cơ chế chú ý
Mô hình đa mô thức ở cấp độ cao cần thiết kế các cơ chế chú ý tinh vi. Cơ chế chú ý về bản chất là một cách phân bổ tài nguyên tính toán một cách động, cho phép mô hình "tập trung" chọn lọc vào những phần liên quan nhất khi xử lý đầu vào của một mô thức.
Tuy nhiên, Web3 AI dựa trên mô-đun khó có thể thực hiện phân bổ chú ý thống nhất. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi định dạng và phân bố dữ liệu trả về từ các API độc lập khác nhau, không thể tạo nên Q/K/V có thể tương tác. Thứ hai, Web3 AI thiếu khả năng phân bổ động đa tuyến theo cách song song, không thể mô phỏng sự phân bổ tinh vi trong cơ chế chú ý, nơi tất cả các vị trí hoặc tất cả các mô hình đều được chấm điểm đồng thời, sau đó tổng hợp lại. Cuối cùng, các mô-đun Web3 AI chỉ có thể thấy "bối cảnh độc lập" của chính mình khi được gọi, giữa chúng không có bối cảnh trung tâm nào được chia sẻ theo thời gian thực, do đó không thể thực hiện liên kết và tập trung toàn cầu giữa các mô-đun.
Tính năng kết hợp vẫn dừng lại ở giai đoạn ghép tĩnh đơn giản
Trong Web2 AI, việc kết hợp đặc trưng là quá trình kết hợp các vectơ đặc trưng thu được từ các mô hình khác nhau sau khi xử lý, dựa trên đồng bộ hóa và chú ý, để phục vụ cho các nhiệm vụ hạ nguồn. Các phương pháp kết hợp có thể từ đơn giản như nối, tổng trọng số, đến phức tạp hơn như pooling song tuyến tính, phân tích tensor thậm chí là công nghệ định tuyến động.
Web3 AI thì thường sử dụng phương pháp ghép các mô-đun rời rạc, đóng gói các loại API thành các Agent độc lập, sau đó đơn giản ghép nối các nhãn, giá trị hoặc báo động ngưỡng mà chúng xuất ra, để đưa ra quyết định tổng hợp qua logic chính hoặc con người. Cách này vừa thiếu mục tiêu đào tạo thống nhất, vừa không có dòng chảy gradient giữa các mô-đun.
Web2 AI ánh xạ tất cả các đặc trưng của các mô hình vào không gian cao chiều hàng ngàn chiều, quá trình tích hợp bao gồm nhiều thao tác tương tác bậc cao, có khả năng nắm bắt các mối quan hệ liên mô hình sâu sắc và phức tạp. Ngược lại, các đầu ra của các tác nhân Web3 AI thường chỉ chứa vài trường hoặc chỉ số chính, với chiều đặc trưng cực thấp, gần như không thể diễn đạt thông tin tinh vi phức tạp.
Rào cản trong ngành AI ngày càng sâu sắc, Web3 AI cần thận trọng trong việc tìm kiếm lối thoát
Hệ thống đa mô thức AI Web2 là một dự án kỹ thuật cực kỳ lớn, cần một khối lượng dữ liệu khổng lồ, sức mạnh tính toán mạnh mẽ, thuật toán tiên tiến và thực hiện kỹ thuật phức tạp. Công việc hệ thống toàn chuỗi, toàn ngăn này yêu cầu rất cao về tài chính, dữ liệu, sức mạnh tính toán, nhân tài và thậm chí là sự phối hợp tổ chức, tạo thành một rào cản ngành nghề rất mạnh.
Web3 AI cần phát triển theo chiến thuật "nông thôn bao vây thành phố", thử nghiệm quy mô nhỏ ở các tình huống biên, đảm bảo nền tảng vững chắc trước khi chờ đợi sự xuất hiện của các tình huống cốt lõi. Cốt lõi của Web3 AI nằm ở tính phi tập trung, và con đường tiến hóa của nó thể hiện bằng khả năng song song cao, độ kết hợp thấp và tính tương thích của sức mạnh tính toán dị thể. Điều này khiến Web3 AI có lợi thế hơn trong các tình huống như tính toán biên, phù hợp với cấu trúc nhẹ, dễ song song và có thể khuyến khích các nhiệm vụ.
Tuy nhiên, rào cản của Web2 AI hiện tại chỉ mới bắt đầu hình thành, đây là giai đoạn đầu của cuộc cạnh tranh giữa các doanh nghiệp hàng đầu. Web3 AI cần chờ đợi cho đến khi lợi ích của Web2 AI gần như biến mất, để lại những điểm đau mới là cơ hội để tham gia. Trước khi điều đó xảy ra, các dự án Web3 AI cần cẩn thận xác định xem có thể tham gia từ bên lề hay không, có thể liên tục cập nhật sản phẩm trong các tình huống nhỏ hay không, và có đủ linh hoạt để thích ứng với nhu cầu thị trường đang thay đổi hay không. Chỉ khi đáp ứng những điều kiện này, các dự án Web3 AI mới có khả năng đứng vững trong thị trường tương lai.