AI an ninh mạng GPT-5.5 của OpenAI vượt qua mô hình Mythos bị cấm của Anthropic

GPT-5.5-Cyber đạt 85,6% trên benchmark CyberGym, vượt qua Mythos 5 của Anthropic dù mô hình này vẫn đang bị đình chỉ hoạt động.

Mô hình an ninh mạng của OpenAI vừa vượt qua mô hình AI Mythos của Anthropic, vốn đã bị Chính phủ Mỹ buộc ngừng hoạt động, trong khi mô hình của OpenAI vẫn đang được vận hành đầy đủ. Ngày 22 tháng 6, OpenAI công bố triển khai đầy đủ GPT-5.5-Cyber như một phần của chương trình phòng thủ mạng Daybreak.

Trên CyberGym, bộ chuẩn đánh giá được phát triển tại Đại học California, Berkeley, đưa ra cho các tác nhân AI 1.507 lỗ hổng phần mềm đã biết từ 188 dự án mã nguồn mở, mô hình cập nhật này đạt 85,6%, mức điểm cao nhất từng được ghi nhận cho một mô hình đơn lẻ trên benchmark này, vượt qua phiên bản GPT-5.5 tiêu chuẩn đạt 81,8%. Mythos 5 của Anthropic đạt 83,8% trên cùng bảng xếp hạng, còn Claude Opus 4.7, mô hình được cung cấp rộng rãi hơn của Anthropic, đạt 73,1%.

BÀI VIẾT LIÊN QUAN

Anthropic bị kiện tập thể vì cáo buộc gây hiểu lầm về hạn mức gói Max

Chính phủ Mỹ yêu cầu Anthropic rút các mô hình AI Claude Fable và Mythos

Anthropic xin lỗi vì cơ chế kiểm duyệt bí mật trong Claude Fable 5

Visa và OpenAI bắt tay xây hạ tầng thanh toán cho kỷ nguyên tác nhân AI

Khoảng cách dưới hai điểm trong bất kỳ bộ chuẩn đánh giá nào thường sẽ không đáng chú ý. Nhưng bối cảnh ở đây thì khác. Mythos 5 và Fable 5 của Anthropic đã bị đưa ngoại tuyến từ ngày 12 tháng 6, sau khi chính quyền Donald Trump ban hành một chỉ thị kiểm soát xuất khẩu khẩn cấp với lý do an ninh quốc gia.

Chính phủ viện dẫn một kỹ thuật vượt rào an toàn AI, tương tự như tìm thấy một chìa khóa vạn năng có thể mở một cánh cửa an ninh cao. Do Anthropic không có cách đáng tin cậy để xác minh quốc tịch người dùng ở quy mô lớn, công ty đã vô hiệu hóa cả hai mô hình cho tất cả mọi người, ở mọi nơi.

Một cách tiếp cận khác

Trong khi Anthropic vẫn đang xử lý vụ việc với các cơ quan quản lý, OpenAI đang mở rộng phạm vi hoạt động của Daybreak.

Chương trình này hiện có sự tham gia của hơn 20 nhà cung cấp sản phẩm an ninh và tám đơn vị tích hợp hệ thống toàn cầu, trong đó các đối tác ban đầu bao gồm Accenture, Akamai, Cisco, Cloudflare, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz và Zscaler, nhằm tích hợp GPT-5.5 cùng tính năng Trusted Access for Cyber vào sản phẩm cho khách hàng đã được thẩm định.

OpenAI cũng ra mắt Patch the Planet, một sáng kiến được thành lập cùng Trail of Bits và phối hợp với HackerOne, nhằm hỗ trợ các dự án mã nguồn mở được sử dụng rộng rãi nhưng có đội ngũ duy trì nhỏ chuyển từ phát hiện lỗ hổng sang khắc phục thực tế, với hơn 30 dự án đã cam kết tham gia, bao gồm cURL, Go, Python, Sigstore và pyca/cryptography.

Dù vậy, GPT-5.5-Cyber không dành cho mục đích sử dụng phổ thông. Mô hình này tiếp tục được giới hạn cho các chuyên gia an ninh đã được xác minh thực hiện công việc được cấp phép, trong khi GPT-5.5 tiêu chuẩn kết hợp với Trusted Access for Cyber được khuyến nghị là điểm khởi đầu cho phần lớn các đội ngũ phòng thủ.

Đây là cùng cách tiếp cận truy cập hạn chế mà Anthropic cũng đã áp dụng với Mythos. Tính đến nay, Fable 5 và Mythos 5 của Anthropic vẫn ngoại tuyến, trong khi Anthropic chưa đưa ra ngày khôi phục chính thức; người dùng quan tâm đến diễn biến này có thể theo dõi các thông báo cập nhật từ Anthropic.