Bộ mô hình AI mới của Meta với kiến trúc MoE tiên tiến và khả năng xử lýBộ mô hình AI mới của Meta với kiến trúc MoE tiên tiến và khả năng xử lý đa phương thức đang thách thức các đối thủ lớn như OpenAI và Google. đa phương thức đang thách thức các đối thủ lớn như OpenAI và Google.
Meta vừa công bố bộ sưu tập mô hình AI thế hệ mới của mình – Llama 4, bao gồm ba phiên bản: Scout, Maverick và Behemoth. Đây được xem là phản ứng trực tiếp trước sự vươn lên mạnh mẽ của các mô hình mã nguồn mở từ DeepSeek (Trung Quốc), công ty đã phát triển các mô hình có hiệu suất ngang bằng hoặc vượt trội hơn dòng Llama trước đây của Meta.
Kiến trúc MoE – bước đột phá công nghệ
Điểm đáng chú ý nhất của Llama 4 là việc Meta lần đầu tiên áp dụng kiến trúc Mixture of Experts (MoE) cho toàn bộ dòng sản phẩm của mình. Kiến trúc này phân chia các tác vụ xử lý dữ liệu thành nhiều nhiệm vụ nhỏ hơn và phân công chúng cho các mô hình “chuyên gia” nhỏ hơn, mang lại hiệu quả tính toán cao hơn đáng kể.
Maverick – mô hình chủ lực với 400 tỷ tham số tổng, nhưng chỉ sử dụng 17 tỷ tham số hoạt động phân phối qua 128 “chuyên gia”. Theo đánh giá nội bộ, Maverick vượt trội OpenAI GPT-4o và Google Gemini 2.0 trong một số bài kiểm tra về lập trình, suy luận, hỗ trợ đa ngôn ngữ và xử lý hình ảnh. Tuy nhiên, mô hình này vẫn chưa đạt được năng lực của Gemini 2.5 Pro, Claude 3.7 Sonnet hay GPT-4.5.
Scout – mô hình nhỏ hơn với 109 tỷ tham số tổng, 17 tỷ tham số hoạt động và 16 “chuyên gia” – nổi bật với khả năng xử lý ngữ cảnh cực lớn lên đến 10 triệu token. Điều này cho phép nó phân tích các tài liệu dài và mã nguồn phức tạp một cách hiệu quả. Đáng chú ý, Scout có thể chạy trên một GPU Nvidia H100 đơn lẻ, trong khi Maverick đòi hỏi hệ thống Nvidia H100 DGX hoặc tương đương.
Behemoth – mô hình đang trong giai đoạn phát triển cuối cùng – sẽ là “quái vật” thực sự với 288 tỷ tham số hoạt động, 16 “chuyên gia” và gần 2 nghìn tỷ tham số tổng. Meta cho biết Behemoth vượt trội GPT-4.5, Claude 3.7 Sonnet và Gemini 2.0 Pro trong nhiều bài đánh giá về kỹ năng STEM như giải quyết vấn đề toán học.
Meta đã cập nhật trợ lý AI của mình trên WhatsApp, Messenger và Instagram để sử dụng Llama 4 tại 40 quốc gia. Tuy nhiên, các tính năng đa phương thức hiện chỉ có sẵn ở Mỹ và bằng tiếng Anh.
Đáng chú ý, giấy phép sử dụng Llama 4 cấm các tổ chức có trụ sở chính tại EU sử dụng hoặc phân phối các mô hình này, có thể do các yêu cầu quản lý từ luật AI và quyền riêng tư dữ liệu của khu vực. Ngoài ra, các công ty có hơn 700 triệu người dùng hoạt động hàng tháng phải yêu cầu giấy phép đặc biệt từ Meta.
Meta cũng tiết lộ rằng họ đã điều chỉnh tất cả mô hình Llama 4 để ít từ chối trả lời các câu hỏi “gây tranh cãi” hơn. Công ty tuyên bố Llama 4 “cân bằng hơn đáng kể” và sẽ phản hồi các chủ đề chính trị và xã hội đang tranh luận mà các mô hình Llama trước đây từ chối. Động thái này diễn ra trong bối cảnh một số đồng minh của Tổng thống Donald Trump, bao gồm Elon Musk, cáo buộc các chatbot AI phổ biến kiểm duyệt quan điểm bảo thủ.
Với Llama 4, Meta đang khẳng định vị thế của mình trong cuộc đua AI toàn cầu, đồng thời mở ra một kỷ nguyên mới cho hệ sinh thái Llama trong tương lai.