Anthropic sier intern testing viste at Claude Fable 5 ikke utgjorde noen unik cybersikkerhetsrisiko, mens Claude Mythos 5 blir tilgjengelig globalt igjen 2. juli.
Innspillet kommer i forbindelse med gjenlanseringen av Fable 5 globalt, etter en 18 dager lang suspensjon utløst av amerikanske eksportkontroller 12. juni. Anthropic testet konkurrerende modeller for å vurdere den reelle risikoen bak restriksjonen.
Hvorfor Anthropic suspenderte Fable 5
Fable 5 og Mythos 5 ble lansert 9. juni, med samme kjernemodell, der førstnevnte var åpen for allmennheten. Mythos 5 forble begrenset til et fåtall betrodde Project Glasswing-partnere for defensivt cybersikkerhetsarbeid.
Eksportkontrollene kom etter at Amazon-forskere fant en måte å omgå sikkerhetstiltakene i Fable 5 på. Teknikken fikk modellen til å identifisere programvaresårbarheter, og i ett tilfelle demonstrere et angrep.
Claude Fable 5 will be available again globally tomorrow.After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…
— Anthropic (@AnthropicAI) July 1, 2026
Anthropics tester viste at både Claude Opus 4,8, GPT-5,5 og Kimi K2,7 kunne identifisere de samme svakhetene som Fable 5 påpekte i Amazon-rapporten. Alle testede modeller klarte også å gjenskape selve utnyttelsen.
Funnene antyder at direktivet rettet seg mot en svakhet som finnes hos hele bransjen, ikke bare Fable 5. Anthropic bygget likevel en sterkere klassifiseringsmodell for å blokkere teknikken, som nå også fanger opp flere vanlige forespørsler om koding og feilsøking.
Slik fungerer beskyttelsen i praksis
Fable 5 ble lansert med den sterkeste sikkerhetsmarginen Anthropic noen gang har lagt i en modell. Klassifiseringssystemet blokkerer forespørsler som virker bare litt risikable, ikke bare de som utgjør en åpenbar fare. Den nye klassifiseringsmodellen, trent etter Amazon-rapporten, blokkerer den rapporterte omgåelsen i over 99 % av tilfellene, ifølge Anthropic. Blokkerte forespørsler blir nå automatisk videresendt til Opus 4,8.
Denne sikkerhetsmarginen har en pris. Anthropic innrømmer at systemet nå også merker flere ufarlige kode- og feilsøkingsforespørsler, og sier at de vil justere det videre for å redusere falske positive. Mythos 5, som har færre slike sikkerhetstiltak, ble kun gjeninnført for Mythos 5-institusjoner godkjent av myndighetene 26. juni.
Anthropics egne data reiser et vanskelig spørsmål. Hvis svakere modeller allerede kan gjøre det Fable 5 ble forbudt for, hva slags standard vil myndigheter bruke neste gang en avansert modell blir lansert?
