Các gã khổng lồ công nghệ như Intel, Google, Microsoft, Meta đang hợp tác để tạo ra một tiêu chuẩn ngành cho kết nối chip AI trong các trung tâm dữ liệu, nhằm giảm sự phụ thuộc vào Nvidia.
Ngày 15/5, nhóm UALink Promoter Group (UALink) chính thức ra mắt với sự tham gia của AMD, Hewlett Packard Enterprise, Broadcom, Cisco và nhiều cái tên sừng sỏ khác (ngoại trừ Arm và Nvidia). Mục tiêu của họ là phát triển một tiêu chuẩn mở cho kết nối các chip tăng tốc AI trong các trung tâm dữ liệu, nhằm phá vỡ sự phụ thuộc vào công nghệ độc quyền của Nvidia.
Phiên bản đầu tiên, UALink 1.0, sẽ kết nối tối đa 1.024 GPU – loại chip tăng tốc AI phổ biến nhất – trong một “pod” máy tính (được định nghĩa là một hoặc nhiều rack máy chủ). Được xây dựng trên các tiêu chuẩn mở như Infinity Fabric của AMD, UALink 1.0 cho phép truyền dữ liệu trực tiếp giữa bộ nhớ của các chip tăng tốc AI, từ đó tăng tốc độ xử lý và giảm độ trễ truyền dữ liệu so với các chuẩn kết nối hiện có.
Dự kiến quý 3/2023, nhóm sẽ thành lập UALink Consortium để giám sát việc phát triển tiêu chuẩn UALink. Phiên bản UALink 1.0 sẽ được cung cấp cho các công ty tham gia liên minh vào cùng thời điểm, trong khi phiên bản nâng cấp với băng thông cao hơn, UALink 1.1, dự kiến ra mắt vào quý 4/2024.
Sự vắng mặt đáng chú ý nhất trong nhóm là Nvidia – nhà sản xuất chip AI lớn nhất thế giới với thị phần ước tính 80 đến 95%. Việc Nvidia không mặn mà với UALink là điều dễ hiểu. Công ty đã có công nghệ kết nối độc quyền riêng cho GPU, đồng thời đang ở vị thế thống trị thị trường, với doanh thu mảng trung tâm dữ liệu (bao gồm chip AI) tăng trưởng hơn 400% so với cùng kỳ năm ngoái.
Bên cạnh AMD và Intel, bên hưởng lợi nhiều nhất từ UALink có lẽ là Microsoft, Meta và Google – những công ty đã chi hàng tỷ USD cho GPU của Nvidia để vận hành dịch vụ đám mây và huấn luyện mô hình AI. Cả ba đều đang nỗ lực tìm giải pháp thay thế cho Nvidia – đối tác đang ngày càng lớn mạnh và có nguy cơ độc quyền trong mảng phần cứng AI.
Theo Gartner, giá trị thị trường chip tăng tốc AI trong máy chủ năm nay sẽ đạt 21 tỷ USD, và dự kiến tăng lên 33 tỷ USD vào năm 2028. Doanh thu chip AI cũng được dự báo đạt 33,4 tỷ USD vào năm 2025.
Google đang tự phát triển chip TPU và Axion cho mục đích huấn luyện và vận hành mô hình AI. Amazon cũng sở hữu một số dòng chip AI. Năm ngoái, Microsoft gia nhập cuộc đua với Maia và Cobalt. Meta cũng không đứng ngoài cuộc chơi với những dòng chip tăng tốc riêng.
Gần đây, Microsoft và OpenAI được cho là đã lên kế hoạch chi ít nhất 100 tỷ USD cho siêu máy tính huấn luyện AI, sử dụng các phiên bản chip Cobalt và Maia trong tương lai. Những con chip này sẽ cần đến giải pháp kết nối – và UALink có thể là câu trả lời.
Sự ra đời của UALink đánh dấu một cuộc cạnh tranh gay gắt trong thị trường chip AI. Liệu UALink có thành công trong việc thách thức Nvidia hay không còn phụ thuộc vào khả năng thu hút thêm nhiều thành viên, tốc độ phát triển tiêu chuẩn và sự chấp nhận của thị trường.