Deep Cogito đưa ra loạt mô hình mã nguồn mở với khả năng chuyển đổi linh hoạt giữa các chế độ, nhắm đến thị phần của Meta và DeepSeek.
Trong làn sóng cạnh tranh ngày càng gay gắt trên thị trường trí tuệ nhân tạo mã nguồn mở, một startup mới từ San Francisco vừa tham gia cuộc đua với giải pháp công nghệ độc đáo. Deep Cogito, được thành lập vào tháng 6/2024, đã chính thức công bố dòng mô hình AI mã nguồn mở đầu tiên của họ với tính năng nổi bật: khả năng chuyển đổi linh hoạt giữa chế độ “lý luận” và chế độ phản hồi nhanh thông thường.
Cogito 1 – tên gọi của dòng mô hình mới – được thiết kế để giải quyết một trong những đánh đổi lớn nhất trong lĩnh vực AI: sự cân bằng giữa tốc độ và độ chính xác. Các mô hình lý luận như o1 của OpenAI đã chứng minh khả năng vượt trội trong việc giải quyết các vấn đề phức tạp bằng phương pháp từng bước, nhưng lại đánh đổi bằng chi phí tính toán cao và độ trễ lớn.
Cogito 1 áp dụng kiến trúc “lai” cho phép mô hình hoạt động ở chế độ phản hồi nhanh cho các câu hỏi đơn giản, đồng thời chuyển sang chế độ lý luận khi đối mặt với các vấn đề phức tạp hơn.
Xây dựng trên nền tảng sẵn có, nhưng với tham vọng vượt trội
Thay vì phát triển mô hình hoàn toàn từ đầu, Deep Cogito đã khôn ngoan xây dựng dựa trên các mô hình mã nguồn mở đã được chứng minh như Llama của Meta và Qwen của Alibaba. Công ty cho biết họ đã áp dụng các phương pháp huấn luyện mới để nâng cao hiệu suất của các mô hình cơ sở và tích hợp khả năng chuyển đổi chế độ.
TÍN DỤNG HÌNH ẢNH: DEEP COGITO
“Mỗi mô hình có thể trả lời trực tiếp hoặc tự suy ngẫm trước khi trả lời, tương tự như các mô hình lý luận. Tất cả đều được phát triển bởi một nhóm nhỏ trong khoảng 75 ngày,” Deep Cogito giải thích trong bài đăng blog của họ.
Hiện tại, dòng sản phẩm Cogito 1 bao gồm các mô hình có quy mô từ 3 tỷ đến 70 tỷ tham số, với mô hình lớn nhất là Cogito 70B. Theo kết quả đánh giá nội bộ, khi kích hoạt chế độ lý luận, Cogito 70B vượt trội hơn so với mô hình lý luận R1 của DeepSeek trong nhiều bài kiểm tra về toán học và ngôn ngữ. Thậm chí khi không sử dụng chế độ lý luận, mô hình này vẫn vượt qua Llama 4 Scout mới ra mắt của Meta trên nền tảng đánh giá LiveBench.
Đặc biệt, Deep Cogito đã công bố kế hoạch tham vọng khi cho biết các mô hình có quy mô lên đến 671 tỷ tham số sẽ được ra mắt trong thời gian tới, điều này cho thấy mức độ đầu tư đáng kể vào công nghệ của họ.
Với sự hậu thuẫn từ quỹ South Park Commons và được dẫn dắt bởi các cựu nhân viên Google có kinh nghiệm trong lĩnh vực AI – Drishan Arora và Dhruv Malhotra, Deep Cogito không giấu giếm tham vọng xây dựng “siêu trí tuệ nhân tạo tổng quát” – AI có khả năng vượt trội hơn con người trong hầu hết các tác vụ và mở ra những khả năng hoàn toàn mới.
Tất cả các mô hình Cogito 1 hiện đã được triển khai và có thể truy cập thông qua API trên các nền tảng đám mây Fireworks AI và Together AI, mở ra cơ hội cho các nhà phát triển và doanh nghiệp tận dụng công nghệ mới này.