OpenAI vừa giới thiệu GPT-4o mini, phiên bản rút gọn tiết kiệm chi phí hơn của GPT-4o, hứa hẹn mở rộng ứng dụng AI với mức giá phải chăng.
Ngày 18/7, OpenAI đã chính thức ra mắt GPT-4o mini, phiên bản thu gọn của mô hình ngôn ngữ lớn (LLM) GPT-4o với khả năng xử lý văn bản và hình ảnh vượt trội. Điểm nhấn của GPT-4o mini nằm ở mức giá cực kỳ cạnh tranh, chỉ 15 xu cho mỗi 1 triệu token đầu vào và 60 xu cho mỗi 1 triệu token đầu ra, rẻ hơn 60% so với GPT-3.5 Turbo và rẻ hơn GPT-4o đến hàng chục lần.
GPT-4o mini được thiết kế để xử lý đa dạng tác vụ với chi phí và độ trễ thấp. Mô hình này phù hợp cho các ứng dụng cần kết nối hoặc xử lý song song nhiều lời gọi mô hình (ví dụ: gọi nhiều API), xử lý lượng lớn ngữ cảnh (ví dụ: toàn bộ cơ sở mã hoặc lịch sử hội thoại) hoặc tương tác với khách hàng thông qua phản hồi văn bản nhanh, thời gian thực (ví dụ: chatbot hỗ trợ khách hàng).
Theo OpenAI, GPT-4o mini đạt 82% điểm số trên MMLU (bộ dữ liệu đánh giá khả năng ngôn ngữ đa nhiệm) và vượt trội GPT-4 trong bài kiểm tra so sánh chatbot LMSYS. Mô hình này có cửa sổ ngữ cảnh 128K token, hỗ trợ tạo tối đa 16K token đầu ra mỗi yêu cầu và sở hữu kiến thức cập nhật đến tháng 10 năm 2023. Nhờ bộ mã hóa được cải thiện từ GPT-4o, GPT-4o mini xử lý văn bản phi tiếng Anh hiệu quả hơn về mặt chi phí.
GPT-4o mini thể hiện khả năng vượt trội so với GPT-3.5 Turbo và các mô hình nhỏ khác trên các bài kiểm tra học thuật, bao gồm cả trí tuệ văn bản và lập luận đa phương thức.
Cụ thể:
- Lập luận: GPT-4o mini đạt 82% điểm trên MMLU, so với 77,9% của Gemini Flash và 73,8% của Claude Haiku.
- Toán và lập trình: GPT-4o mini ghi điểm 87% trên MGSM (đo lường lập luận toán học) và 87,2% trên HumanEval (đo lường hiệu suất viết mã), vượt trội so với các đối thủ cạnh tranh.
- Lập luận đa phương thức: GPT-4o mini đạt 59,4% trên MMMU (đánh giá lập luận đa phương thức), so với 56,1% của Gemini Flash và 50,2% của Claude Haiku.
OpenAI đã hợp tác với các đối tác đáng tin cậy như Ramp và Superhuman để đánh giá GPT-4o mini. Kết quả cho thấy, mô hình mới vượt trội so với GPT-3.5 Turbo trong các tác vụ như trích xuất dữ liệu có cấu trúc từ tệp biên lai hoặc tạo email phản hồi chất lượng cao.
Mặc dù là phiên bản thu gọn, OpenAI vẫn đảm bảo tính an toàn cho GPT-4o mini. Mô hình này được trang bị các biện pháp giảm thiểu rủi ro tương tự GPT-4o, đã được đánh giá bởi hơn 70 chuyên gia đầu ngành trong các lĩnh vực. OpenAI cũng tích hợp ngay từ giai đoạn tiền huấn luyện bằng cách lọc thông tin độc hại như ngôn từ kích động thù địch, nội dung người lớn, trang web thu thập thông tin cá nhân và spam
Hiện tại, GPT-4o mini đã có sẵn dưới dạng mô hình văn bản và hình ảnh trong API Trợ lý, API Hoàn thành Cuộc trò chuyện và API Hàng loạt. Người dùng ChatGPT Free, Plus và Team có thể sử dụng GPT-4o mini (thay thế GPT-3.5) ngay từ hôm nay. Người dùng Doanh nghiệp sẽ được tiếp cận mô hình này vào tuần sau.
Với sự ra mắt của GPT-4o mini, OpenAI đang tiến thêm một bước nữa trong việc hiện thực hóa tầm nhìn về một tương lai mà AI được tích hợp liền mạch vào mọi ứng dụng và trang web, mang lại lợi ích cho tất cả mọi người.