UK AISI: GPT-5.5 MATCHES MYTHOS ON CYBER TASKS

Viện An ninh AI Vương quốc Anh (@AISecurityInst) đã thông báo trong tuần này rằng GPT 5.5 của OpenAI tương đương hoặc hơi vượt qua Claude Mythos Preview của Anthropic trong các bài kiểm tra bảo mật mạng tiên tiến.
GPT 5.5 cũng trở thành mô hình thứ hai - sau Mythos Preview - hoàn thành mô phỏng tấn công mạng doanh nghiệp 32 bước “The Last Ones” của AISI, một nhiệm vụ ước tính mất khoảng 20 giờ cho một chuyên gia con người. GPT 5.5 đã thành công trong 2 trên 10 lần chạy, trong khi Mythos đạt được 3 trên 10.
Sự khác biệt nằm ở khả năng tiếp cận. GPT 5.5 có thể truy cập qua ChatGPT và API, trong khi Mythos chỉ giới hạn cho 50–120 tổ chức dưới Dự án Glasswing. Nhóm red team AISI cũng đã phát hiện ra một phương pháp jailbreak toàn cầu cho GPT 5.5 chỉ trong vòng sáu giờ, vượt qua tất cả các yêu cầu mạng độc hại đã được đánh dấu.
Những kết quả này làm phức tạp thêm lập trường phản đối gần đây của Nhà Trắng. Kể từ khi GPT 5.5 - đã có sẵn công khai - cho thấy khả năng ở cấp độ Mythos, việc hạn chế quyền truy cập Mythos dựa trên lý do khả năng trở nên khó biện minh hơn.