Trong sự kiện Google Cloud Next ’24 tại Las Vegas, Google Cloud (GCP) đã trình làng hàng loạt các tính năng mới, nổi bật nhất là chip Axion tùy chỉnh dựa trên nền tảng Arm và các bộ tăng tốc AI.
Về mảng tăng tốc AI, Google sẽ hợp tác với Nvidia để tích hợp nền tảng Nvidia Blackwell dự kiến ra mắt vào năm 2025, bao gồm GPU HGX B200 siêu nhanh và NBL72 GB200, GPU lý tưởng cho các tác vụ AI đòi hỏi hiệu năng cao như huấn luyện mô hình ngôn ngữ lớn (LLM).
Đối với nhu cầu huấn luyện LLM hiện tại, Google giới thiệu A3 Mega – sự kết hợp giữa GPU H100 tiêu chuẩn và hệ thống mạng mới, cung cấp băng thông gấp đôi trên mỗi GPU. Biến thể khác là A3 Confidential ưu tiên bảo mật dữ liệu nhạy cảm, mã hóa dữ liệu end-to-end trong quá trình truyền giữa CPU Intel.
Google cũng giới thiệu Cloud TPU v5p, bộ xử lý tăng tốc AI mạnh mẽ nhất do hãng tự phát triển, với hiệu năng tính toán dấu phẩy động được cải thiện gấp đôi và tốc độ băng thông bộ nhớ tăng gấp ba lần so với thế hệ trước.
Bên cạnh chip, Google còn cung cấp các tùy chọn lưu trữ tối ưu cho AI như Hyperdisk ML, có thể cải thiện thời gian tải model lên đến 3,7 lần.
Ngoài ra, Google cũng sẽ giới thiệu các phiên bản C4 và N4 đa dụng mới, được hỗ trợ bởi bộ xử lý Xeon thế hệ thứ 4 và thứ 5 của Intel, cùng với các máy kim loại trần C3, phiên bản kim loại trần tối ưu hóa bộ nhớ X4 và máy ảo Z3 tối ưu hóa cho lưu trữ.
Những cải tiến tại Google Cloud Next ’24 cho thấy cam kết của Google Cloud trong việc cung cấp cho khách hàng các giải pháp điện toán đám mây mạnh mẽ, linh hoạt và hiệu quả nhất.