L'UK AI Security Institute (@AISecurityInst) ha annunciato questa settimana che GPT 5.5 di OpenAI eguaglia o supera leggermente l'Anteprima di Claude Mythos nei test avanzati di sicurezza informatica.
GPT 5.5 è diventato anche solo il secondo modello—dopo l'Anteprima di Mythos—ad completare la simulazione di attacco alla rete aziendale “The Last Ones” di AISI in 32 passaggi, un compito stimato richiedere a un esperto umano circa 20 ore. GPT 5.5 ha avuto successo in 2 di 10 tentativi, mentre Mythos ha gestito 3 di 10.
La differenza è nella disponibilità. GPT 5.5 è accessibile tramite ChatGPT e l'API, mentre Mythos rimane limitato a 50–120 organizzazioni sotto il Progetto Glasswing. I red teamers di AISI hanno anche scoperto un jailbreak universale per GPT 5.5 in sei ore che ha bypassato tutte le richieste informatiche malevole segnalate.
Questi risultati complicano la recente posizione di opposizione della Casa Bianca. Poiché GPT 5.5—già disponibile pubblicamente—mostra capacità a livello Mythos, limitare l'accesso a Mythos per motivi di capacità è più difficile da giustificare.
