OpenAI hôm nay đã chính thức ra mắt GPT-5, mô hình mạnh mẽ nhất từ trước đến nay, và cung cấp miễn phí cho tất cả người dùng.
Sau nhiều tháng chờ đợi, OpenAI đã chính thức giới thiệu GPT-5, thế hệ mô hình ngôn ngữ lớn mới nhất trong bối cảnh cạnh tranh gay gắt với Meta, Anthropic và Google. CEO Sam Altman mô tả đây là “bước nâng cấp quan trọng so với GPT-4 và bước tiến lớn trên con đường hướng tới AGI”, đồng thời nhấn mạnh khả năng “viết một chương trình phần mềm từ con số 0” của mô hình mới.
Trong một ví dụ thực tế, GPT-5 đã viết hơn 400 dòng code trong vòng hai phút từ một yêu cầu mô phỏng hiệu ứng Bernoulli, thể hiện năng lực lập trình ấn tượng. Altman so sánh: “GPT-4 giống như nói chuyện với một sinh viên đại học. Giờ đây, GPT-5 giống như nói chuyện với một chuyên gia.”
Thách thức về cửa sổ ngữ cảnh
Mặc dù GPT-5 có cửa sổ ngữ cảnh 400.000 token, gấp bốn lần GPT-4, con số này vẫn thua xa các đối thủ như Claude 3 và Gemini 1.5 với khả năng xử lý trên 1 triệu token. Đây là yếu tố quan trọng quyết định lượng thông tin mà mô hình có thể “ghi nhớ” và xử lý trong một tương tác duy nhất, bao gồm tài liệu dài, codebase phức tạp và các cuộc hội thoại mở rộng.
Sự chênh lệch này khiến GPT-5 dường như đang “đuổi kịp” thay vì “vượt mặt” đối thủ. Claude hiện có thể tiếp nhận toàn bộ một bộ sách hay repository code khổng lồ và vẫn phản hồi mạch lạc theo ngữ cảnh.
GPT-5 mang đến hàng loạt tính năng mới, bao gồm khả năng video cho phép mô hình “quan sát” người dùng qua camera và tích hợp Gmail, Google Calendar sẽ ra mắt tuần tới. Mô hình mới khả dụng cho toàn bộ người dùng từ hôm nay, trong đó người dùng miễn phí sẽ bị giới hạn lưu lượng và chuyển sang phiên bản “mini” khi đạt ngưỡng.
OpenAI đặc biệt chú trọng ứng dụng doanh nghiệp với khả năng lập luận nâng cao thông qua “Kiến trúc lập luận thống nhất”. Công ty loại bỏ sự đánh đổi giữa tốc độ và độ sâu phân tích, cho phép người dùng có được câu trả lời nhanh chóng mà không mất tính chính xác.
Về hiệu năng, OpenAI khẳng định GPT-5 “nhanh hơn, đáng tin cậy hơn và chính xác hơn” phiên bản trước, đồng thời là “mô hình lập trình tốt nhất từ trước đến nay”. Đặc biệt, tỷ lệ hallucination giảm đáng kể, giải quyết thách thức lớn trong triển khai LLM cho doanh nghiệp.
Đột phá quan trọng nằm ở phương pháp huấn luyện dữ liệu tổng hợp mới. “Đột phá của chúng tôi không nằm ở việc tạo ra nhiều dữ liệu hơn, mà là tạo ra đúng loại dữ liệu,” OpenAI giải thích, nhấn mạnh hiệu quả vượt trội so với phương pháp thu thập dữ liệu truyền thống.
GPT-5 còn tích hợp hệ thống ghi nhớ cá nhân hóa, cho phép điều chỉnh hành vi chatbot theo yêu cầu cụ thể của từng người dùng xuyên suốt nhiều cuộc trò chuyện. Trong lập trình, mô hình đạt hiệu suất cao nhất trên SWE-bench và hỗ trợ ba biến thể khác nhau để tối ưu chi phí token.
Với 700 triệu người dùng hoạt động hàng tuần của ChatGPT, so với 47 triệu của Google Gemini, OpenAI duy trì vị thế dẫn đầu. Tuy nhiên, Meta AI cũng đạt 700 triệu người dùng nhờ tích hợp vào Instagram và WhatsApp, tạo nên cuộc cạnh tranh khốc liệt.
OpenAI hiện được định giá 300 tỷ USD sau khi huy động 57 tỷ USD qua 11 vòng gọi vốn, với khả năng tăng lên 500 tỷ USD nếu thương vụ bán cổ phần mới được thực hiện. Công ty dự kiến đạt doanh thu 20 tỷ USD trước cuối năm sau khi nhân đôi trong 7 tháng đầu.
Altman lần đầu xác nhận OpenAI bắt đầu phát triển GPT-5 từ năm 2023, với giai đoạn huấn luyện thực tế từ một năm sau. Trước đó, công ty đã phát hành hai mô hình open-weight – gpt-oss-120b và gpt-oss-20b – theo giấy phép mở cho các nhà phát triển muốn chạy mô hình cục bộ.