ByteDance đang tự phát triển GPU cho AI, nhiều khả năng sẽ do TSMC sản xuất nhằm giảm phụ thuộc vào Nvidia và tuân thủ các quy định xuất khẩu của Mỹ.
Theo nguồn tin từ Tomshardware, ByteDance đang trong quá trình thiết kế GPU riêng dành cho trí tuệ nhân tạo (AI), với mục tiêu giảm sự phụ thuộc vào Nvidia, nhà cung cấp GPU hàng đầu hiện nay. Động thái này được cho là nhằm đối phó với tình trạng khan hiếm GPU cũng như các quy định kiểm soát xuất khẩu ngày càng nghiêm ngặt của Mỹ.
ByteDance được cho là đang thiết kế hai loại GPU, một dành cho huấn luyện AI (AI training) và một dành cho suy luận AI (AI inference). Broadcom, công ty đã từng thiết kế chip AI cho Google, khả năng là sẽ tiếp tục chịu trách nhiệm thiết kế chip cho ByteDance. GPU này sẽ được sản xuất trên tiến trình N4/N5 của TSMC, tương tự như dòng GPU Blackwell của Nvidia dành cho AI và HPC. Sản phẩm GPU AI của ByteDance dự kiến sẽ được triển khai vào khoảng năm 2026.
Mặc dù GPU của ByteDance được kỳ vọng sẽ có chi phí thấp hơn so với các sản phẩm của Nvidia, nhưng khả năng cạnh tranh về hiệu năng có thể bị hạn chế bởi các quy định kiểm soát xuất khẩu của Mỹ. TSMC có thể không được phép sản xuất chip có hiệu năng vượt trội so với GPU HGX H20 hiện tại của Nvidia, khiến ByteDance khó lòng vượt mặt đối thủ về tốc độ xử lý.
Trong năm nay, ByteDance đã đầu tư hơn 2 tỷ USD để mua hơn 200.000 GPU Nvidia H20, mỗi GPU có giá khoảng 10.000 USD. Sự đầu tư lớn này cho thấy tầm quan trọng của AI đối với chiến lược tổng thể của ByteDance. Tuy nhiên, việc thiếu hụt GPU Nvidia cùng với giá cả cao đã thúc đẩy ByteDance tự phát triển giải pháp phần cứng AI riêng.
Tự chủ trong sản xuất GPU AI được kỳ vọng sẽ giúp ByteDance kiểm soát chi phí hiệu quả hơn, đặc biệt khi các GPU Nvidia, dù đã được tinh chỉnh cho thị trường Trung Quốc, vẫn có giá cao.
Thách thức về hệ sinh thái phần mềm của ByteDance
Tuy nhiên, ByteDance cũng phải đối mặt với thách thức về phát triển hệ sinh thái phần mềm cho GPU AI mới. Hiện tại, công ty đang phụ thuộc vào CUDA và các công cụ hỗ trợ của Nvidia trong quá trình huấn luyện và suy luận AI.
Chuyển sang sử dụng GPU tự chế tạo đồng nghĩa với việc ByteDance cần phải tự xây dựng một nền tảng phần mềm hoàn chỉnh và đảm bảo khả năng tương thích với phần cứng mới. Đây là một bài toán khó không chỉ với ByteDance mà còn với nhiều công ty Trung Quốc khác đang nỗ lực tự phát triển GPU AI. Việc phụ thuộc vào các giải pháp của Nvidia cho một số tác vụ cũng là hiện trạng chung của nhiều doanh nghiệp trong nước.
Theo dự đoán, Nvidia sẽ bán ra hơn 1 triệu GPU HGX H20 cho thị trường Trung Quốc trong năm nay, gần gấp đôi doanh số của Huawei với dòng GPU Ascend 910B AI, dự kiến đạt 550.000 đơn vị vào năm 2024. Doanh thu từ GPU HGX H20 có thể mang về cho Nvidia hơn 12 tỷ USD, vượt qua tổng thu nhập từ thị trường Trung Quốc trong năm trước đó.