Anthropic phát hành Claude Mythos 5 với năng lực an ninh mạng chưa từng có, giới hạn quyền truy cập cho tổ chức được phê duyệt, cùng phiên bản Fable 5 dành cho công chúng.
Anthropic hôm thứ Ba chính thức công bố ra mắt Claude Mythos 5 và Claude Fable 5, hai mô hình AI thuộc thế hệ mới nhất của công ty, đánh dấu bước leo thang đáng kể về năng lực kỹ thuật, đồng thời đặt ra những câu hỏi chưa có tiền lệ về cách thức phát hành AI có khả năng cao trong thực tế.
Mythos 5 sẽ chỉ được cấp quyền truy cập cho các tổ chức an ninh mạng được phê duyệt, đơn vị vận hành hạ tầng trọng yếu, đối tác chính phủ và một số nhà nghiên cứu khoa học sự sống được lựa chọn, tiếp nối Project Glasswing khởi động từ tháng 4, khi Anthropic bắt đầu thử nghiệm mô hình Mythos Preview với nhóm hạn chế gồm các lực lượng phòng thủ mạng.
Công ty tuyên bố các mô hình lớp Mythos “đã đạt đến một ngưỡng mà tại đó chúng đặt ra những rủi ro đáng kể,” nhưng lập luận rằng chính năng lực đó làm cho chúng trở nên hữu ích trong việc phát hiện và vá lỗ hổng trước khi kẻ tấn công khai thác.
Điểm số kỷ lục, rủi ro chưa từng có
Các con số hiệu suất mà Anthropic công bố cho thấy bước nhảy vọt rõ rệt so với các thế hệ trước: Mythos 5 và Fable 5 đạt 78% trên ExploitBench, bộ đánh giá đo lường khả năng phát hiện và khai thác lỗ hổng phần mềm, và 88% trên Terminal-Bench đánh giá năng lực lập trình.
Những con số này không xuất hiện trong chân không: đầu năm nay, Viện An ninh AI của Vương quốc Anh ghi nhận một phiên bản xem trước của Mythos là mô hình AI đầu tiên hoàn thành một bài tập xâm nhập mạng doanh nghiệp gồm 32 bước mà không cần sự hỗ trợ của con người; Mozilla báo cáo phiên bản đó đã tự phát hiện hơn 271 lỗ hổng trong trình duyệt Firefox chỉ trong tháng 4.
Song song với Mythos 5, Fable 5 được thiết kế cho phạm vi sử dụng công khai rộng hơn, dùng cùng kiến trúc lõi nhưng bổ sung thêm các lớp bảo vệ. Để giảm thiểu rủi ro lạm dụng, các yêu cầu liên quan đến an ninh mạng, sinh học, hóa học hoặc sao chép mô hình AI sẽ được chuyển hướng xử lý bởi Claude Opus 4.8, một cơ chế mà Anthropic cho biết chỉ được kích hoạt trong chưa đến 5% số phiên làm việc.
Việc ra mắt diễn ra trong bối cảnh quan hệ giữa Anthropic và chính quyền Mỹ đang có chiều hướng xích lại gần nhau. Các báo cáo đầu tháng cho biết công ty đã bố trí kỹ sư tại Cơ quan An ninh Quốc gia Mỹ để hỗ trợ triển khai Mythos cho các hoạt động an ninh mạng nhắm vào Trung Quốc và Iran. Anthropic cho biết sẽ tiếp tục mở rộng quyền truy cập Mythos 5 “thông qua một chương trình truy cập tin cậy rộng hơn” và đang xây dựng quy trình nộp đơn có hệ thống cho các tổ chức an ninh mạng muốn tham gia.
Trong khi đó, CEO OpenAI Sam Altman đã công khai chỉ trích chiến lược truyền thông của Anthropic là “tiếp thị dựa trên nỗi sợ”, một lời cáo buộc mà Anthropic chưa phản hồi trực tiếp, nhưng phản ánh cuộc tranh luận ngày càng gay gắt trong ngành về ranh giới giữa minh bạch rủi ro và thổi phồng nguy cơ.







































































