Chi phí vận hành cao buộc OpenAI phải ngừng cung cấp mô hình AI lớn nhất của mình qua API, thay thế bằng GPT-4.1 với hiệu suất tương đương nhưng chi phí thấp hơn.
OpenAI vừa công bố kế hoạch sẽ sớm ngừng cung cấp mô hình GPT-4.5, mô hình AI lớn nhất từ trước đến nay của công ty, thông qua API của họ. Thông báo này được đưa ra chỉ sau khoảng hai tháng kể từ khi GPT-4.5 được ra mắt vào cuối tháng 2.
Theo thông báo, các nhà phát triển sẽ tiếp tục được truy cập GPT-4.5 qua API của OpenAI đến ngày 14/7, sau đó họ sẽ phải chuyển sang sử dụng một mô hình khác trong danh mục sản phẩm của công ty. OpenAI đang định vị GPT-4.1, vừa được ra mắt hôm thứ Hai, như là giải pháp thay thế được ưa chuộng.
“[GPT-4.1] cung cấp hiệu suất tương đương hoặc tốt hơn so với GPT-4.5 trong các lĩnh vực chính với chi phí thấp hơn nhiều,” đại diện OpenAI chia sẻ qua email với TechCrunch. “[C]húng tôi sẽ loại bỏ GPT-4.5 để ưu tiên phát triển các mô hình trong tương lai.”
Để làm rõ, GPT-4.5 sẽ không biến mất khỏi ChatGPT, nơi nó vẫn được cung cấp dưới dạng bản xem trước nghiên cứu cho khách hàng trả phí. OpenAI chỉ loại bỏ nó khỏi API.
Chi phí vận hành khổng lồ đằng sau quyết định
GPT-4.5, với tên mã Orion, được huấn luyện bằng sức mạnh tính toán và dữ liệu lớn hơn bất kỳ phiên bản nào trước đây của OpenAI. Nó cải thiện so với người tiền nhiệm, GPT-4o, trong các lĩnh vực như viết lách và khả năng thuyết phục, nhưng mặc dù có quy mô lớn, GPT-4.5 vẫn chưa đạt đến “cấp độ tiên phong” trên một số tiêu chuẩn đánh giá của ngành.
OpenAI thừa nhận rằng GPT-4.5 rất tốn kém để vận hành – đắt đến mức công ty đã cảnh báo từ tháng 2 rằng họ đang đánh giá liệu có nên cung cấp GPT-4.5 qua API của mình trong dài hạn hay không. Giá của mô hình phản ánh điều này: GPT-4.5 có giá 75 USD cho mỗi triệu token đầu vào (khoảng 750.000 từ) và 150 USD cho mỗi triệu token đầu ra, khiến nó trở thành một trong những sản phẩm đắt đỏ nhất của OpenAI.
Quyết định này đánh dấu một bước ngoặt trong chiến lược phát triển sản phẩm của OpenAI, khi công ty dường như đang cân nhắc giữa hiệu suất và khả năng tiếp cận thương mại. Việc ra mắt GPT-4.1 với hiệu suất tương đương nhưng chi phí thấp hơn cho thấy OpenAI đang tìm cách tối ưu hóa danh mục sản phẩm của mình, đồng thời dành nguồn lực cho việc phát triển các mô hình AI tiên tiến hơn trong tương lai.