Fusion của OpenRouter ghép mô hình giá rẻ để đua tầm với Claude Fable

OpenRouter ra mắt Fusion, kết hợp nhiều mô hình AI chi phí thấp đạt 64,7% trên benchmark DRACO, gần ngang Claude Fable 5 với chi phí chỉ bằng một nửa.

OpenRouter vừa giới thiệu Fusion, một API mô hình kết hợp dựa trên giả định rằng một nhóm mô hình AI chi phí thấp, khi được kết hợp đúng cách, có thể đạt năng lực tương đương một mô hình đắt tiền duy nhất, cụ thể là Claude Fable 5.

Thời điểm ra mắt khá thuận lợi: không lâu sau khi Fable 5 và Mythos 5 được phát hành, một chỉ thị kiểm soát xuất khẩu của Mỹ đã buộc Anthropic đình chỉ các mô hình này đối với công dân nước ngoài trên toàn thế giới, liên quan đến một phát hiện bẻ khóa rào chắn an toàn còn gây tranh cãi. Ngay sau đó, OpenRouter đã quảng bá Fusion như một giải pháp lấp khoảng trống, với lời hứa “trí tuệ ngang cấp Fable với một nửa chi phí”.

BÀI VIẾT LIÊN QUAN

Alchemy ra mắt AgentCard, trao quyền thanh toán cho tác nhân AI

Estonia muốn cấp mã định danh quốc gia riêng cho các tác nhân AI

Nvidia phát triển các robot tự huấn luyện bằng tác nhân lập trình AI

Các nhà tâm lý học Mỹ cho biết bệnh nhân đang đưa AI vào các buổi trị liệu

Về cơ chế hoạt động, khi nhận một câu lệnh, Fusion sẽ chuyển câu lệnh đó đến nhiều mô hình song song, mỗi mô hình được cấp công cụ tìm kiếm web và công cụ bash. Một mô hình giám khảo sau đó trích xuất các điểm đồng thuận, mâu thuẫn và điểm mù từ các phản hồi, trước khi một bộ tổng hợp, mặc định là Claude Opus 4.8, viết câu trả lời cuối cùng.

Toàn bộ quá trình diễn ra phía máy chủ, cho phép người dùng đổi chuỗi mô hình sang “openrouter/fusion”, thêm Fusion như một công cụ gọi chọn lọc, hoặc tự xây dựng nhóm mô hình tùy chỉnh.

Kết quả benchmark và những giới hạn cần lưu ý

Trên bộ chuẩn đánh giá DRACO của Perplexity, tổ hợp Fable 5 kết hợp GPT-5.5 và được Opus tổng hợp đứng đầu với 69%, trong khi Fable chạy độc lập đạt 65,3%. Đáng chú ý hơn về mặt chi phí, tổ hợp Gemini 3 Flash kết hợp Kimi K2.6 và DeepSeek V4 Pro, được Opus tổng hợp, đạt 64,7% — vượt GPT-5.5 độc lập (60%) và Opus 4.8 độc lập (58,8%), chỉ kém Fable chưa đến một điểm phần trăm nhưng với chi phí chỉ bằng khoảng một nửa.

Ngay cả việc ghép Opus 4.8 với chính nó cũng đạt 65,5%, tăng 6,7 điểm so với chạy đơn lẻ, trong đó khoảng ba phần tư mức cải thiện đến từ bước tổng hợp.

OpenRouter cũng thừa nhận một rủi ro nhiễm dữ liệu đánh giá khi các mô hình có quyền truy cập web có thể vô tình phát hiện tiêu chí chấm điểm của DRACO trong kết quả tìm kiếm; vấn đề này được xử lý bằng cách loại trừ các miền lưu trữ benchmark khỏi công cụ tìm kiếm trước khi công bố số liệu chính thức.

Tuy vậy, OpenRouter khẳng định Fusion không phải giải pháp thay thế hoàn chỉnh cho Fable. DRACO không đánh giá các tác vụ dài hạn, lĩnh vực Fable được cho là vẫn vượt trội, còn trong lập trình, Fusion chỉ đóng vai trò công cụ hỗ trợ gọi chọn lọc.

Phản ứng từ giới chuyên môn cũng phân hóa: nhà nghiên cứu Andrew Trask đánh giá đây là bước tiến lớn cho thấy các phòng thí nghiệm tuyến đầu không còn độc quyền tuyệt đối, trong khi những người hoài nghi chỉ ra kết quả lập trình còn yếu và việc Fable 5 hiện không khả dụng khiến việc so sánh trực tiếp trở nên khó khăn.

Với những người bị ảnh hưởng bởi lệnh kiểm soát xuất khẩu, các lựa chọn hiện có bao gồm nhóm Fusion, phương án thay thế phần phụ trợ như DeepClaude, hoặc các mô hình trọng số mở như GLM-5.2.

Tags: AI