Mô hình AI thử nghiệm của OpenAI giải đúng 5/6 bài toán IMO 2025 với 35/42 điểm, đánh dấu bước tiến quan trọng trong phát triển trí tuệ tổng quát.
OpenAI vừa công bố một bước đột phá quan trọng trong lĩnh vực trí tuệ nhân tạo khi mô hình AI thử nghiệm của họ đạt được hiệu suất tương đương huy chương vàng tại Olympic Toán học Quốc tế 2025. Thành tựu này được coi là một trong những cột mốc quan trọng nhất trong hành trình phát triển AI có khả năng suy luận phức tạp, đánh dấu sự tiến bộ vượt bậc từ các mô hình chuyên biệt sang trí tuệ tổng quát.
Alexander Wei từ nhóm nghiên cứu suy luận của OpenAI tiết lộ rằng mô hình được thử nghiệm trong điều kiện hoàn toàn tương tự như thí sinh con người, không có quyền truy cập internet hay bất kỳ công cụ hỗ trợ nào. Trong hai phiên thi kéo dài 4,5 giờ mỗi phiên, mô hình đã giải quyết thành công năm trong số sáu bài toán, đạt 35 trên tổng số 42 điểm có thể.
Điều đặc biệt ấn tượng là các lời giải được trình bày dưới dạng lập luận ngôn ngữ tự nhiên, cho thấy khả năng không chỉ tìm ra đáp án đúng mà còn diễn đạt quá trình suy luận một cách logic và có hệ thống. Ba cựu thí sinh từng đoạt huy chương IMO đã được mời chấm điểm và xác nhận kết quả này vượt ngưỡng huy chương vàng.
Bước tiến từ AI chuyên biệt sang trí tuệ tổng quát
Thành tựu này có ý nghĩa đặc biệt quan trọng bởi cách thức đạt được kết quả. Wei nhấn mạnh rằng OpenAI không sử dụng các phương pháp hẹp hay chuyên biệt theo từng tác vụ cụ thể, mà thay vào đó mở rộng giới hạn của học tăng cường đa năng và nâng cao năng lực tính toán tại thời điểm kiểm tra. Cách tiếp cận này thể hiện triết lý phát triển AI tổng quát thay vì tối ưu hóa cho một lĩnh vực riêng biệt.
Giám đốc điều hành Sam Altman cũng nhấn mạnh rằng mô hình đạt thành tích này không phải là mô hình được huấn luyện chuyên biệt cho toán học, mà là một mô hình AI tổng quát. Điều này cho thấy khả năng ứng dụng rộng rãi của công nghệ này trong nhiều lĩnh vực khác nhau, từ khoa học tự nhiên đến các ngành kỹ thuật phức tạp.
Altman coi thành tựu này là một phần trong chiến lược cốt lõi của OpenAI nhằm tiến đến trí tuệ tổng quát, đồng thời khẳng định đây là dấu mốc quan trọng thể hiện mức độ tiến bộ của AI trong thập kỷ qua. Olympic Toán học Quốc tế từ lâu được coi là một trong những thử thách khó khăn nhất để đánh giá khả năng suy luận logic và giải quyết vấn đề, do đó việc AI đạt được thành tích này có ý nghĩa đặc biệt quan trọng.
Tuy nhiên, OpenAI cho biết người dùng không nên kỳ vọng mô hình suy luận tiên tiến này sẽ sớm được phát hành công khai. Altman xác nhận rằng dù ChatGPT-5 sẽ sớm ra mắt với nhiều cải tiến, phiên bản này sẽ không có năng lực suy luận như mô hình thử nghiệm chưa được đặt tên. Công ty không có kế hoạch phát hành mô hình đạt cấp độ IMO huy chương vàng trong vài tháng tới, cho thấy khoảng cách giữa nghiên cứu tiên tiến và sản phẩm thương mại vẫn còn đáng kể.