Các mô hình AI mới của OpenAI có thể dừng lại và suy nghĩ trước khi trả lời, cho phép xử lý hình ảnh và thực thi mã Python trực tiếp trong trình duyệt.
OpenAI vừa chính thức ra mắt hai mô hình trí tuệ nhân tạo mới o3 và o4-mini vào hôm thứ Năm. Đây là những mô hình lập luận được thiết kế để “tạm dừng và suy nghĩ” trước khi đưa ra câu trả lời, đánh dấu bước tiến quan trọng trong cuộc đua AI toàn cầu ngày càng gay gắt.
Theo OpenAI, o3 là mô hình lập luận tiên tiến nhất của họ từ trước đến nay, vượt trội hơn các mô hình trước đây trong các bài kiểm tra về toán học, lập trình, lập luận, khoa học và khả năng hiểu hình ảnh. Mô hình o4-mini được giới thiệu như một lựa chọn cân bằng giữa giá thành, tốc độ và hiệu suất – ba yếu tố quan trọng mà các nhà phát triển thường cân nhắc khi lựa chọn mô hình AI.
Đột phá công nghệ trong bối cảnh cạnh tranh khốc liệt
Điểm đáng chú ý là các mô hình này có thể tạo ra phản hồi bằng cách sử dụng các công cụ trong ChatGPT như duyệt web, thực thi mã Python, xử lý và tạo hình ảnh. Đặc biệt, o3 và o4-mini là những mô hình đầu tiên của OpenAI có khả năng “suy nghĩ với hình ảnh” – người dùng có thể tải lên hình ảnh như bản phác thảo trên bảng trắng hoặc sơ đồ từ tài liệu PDF, và các mô hình sẽ phân tích hình ảnh trong quá trình “chuỗi suy nghĩ” trước khi trả lời.
Về hiệu suất, o3 đạt kết quả ấn tượng trong bài kiểm tra SWE-bench verified (không có scaffolding tùy chỉnh) với điểm số 69,1%, vượt trội so với o3-mini (49,3%) và Claude 3.7 Sonnet (62,3%).
Việc OpenAI phát hành o3 là một bước ngoặt đáng chú ý, đặc biệt khi CEO Sam Altman đã từng phát tín hiệu vào tháng 2 rằng công ty dự định tập trung nguồn lực vào một giải pháp thay thế tinh vi hơn tích hợp công nghệ của o3. Tuy nhiên, áp lực cạnh tranh dường như đã thúc đẩy OpenAI thay đổi hướng đi.
Cả ba mô hình – o3, o4-mini và o4-mini-high (biến thể dành nhiều thời gian hơn để cải thiện độ tin cậy) – hiện đã có sẵn cho người đăng ký các gói Pro, Plus và Team của OpenAI, đồng thời cũng sẽ được cung cấp thông qua các endpoint dành cho nhà phát triển, bao gồm Chat Completions API và Responses API.
Về giá cả, OpenAI tính phí tương đối thấp cho o3 với $10 cho mỗi triệu input token và $40 cho mỗi triệu output token. Đối với o4-mini, giá được giữ ở mức tương đương với o3-mini, $1,10 cho mỗi triệu input token và $4,40 cho mỗi triệu output token.
Trong những tuần tới, OpenAI dự kiến sẽ phát hành o3-pro, một phiên bản của o3 sử dụng nhiều tài nguyên tính toán hơn, dành riêng cho người đăng ký ChatGPT Pro. Sam Altman cũng đã cho biết o3 và o4-mini có thể là những mô hình lập luận AI độc lập cuối cùng trong ChatGPT trước khi GPT-5 ra mắt – mô hình dự kiến sẽ thống nhất các mô hình truyền thống như GPT-4.1 với các mô hình lập luận.