Claude Mythos: il modello AI di Anthropic per la cybersecurity di frontiera
Cos'è Claude Mythos, il modello di intelligenza artificiale di Anthropic specializzato nella scoperta autonoma di vulnerabilità, e perché il suo accesso è ristretto.
15 giugno 2026·7 min di lettura
Claude MythosAnthropicintelligenza artificialecybersecurityvulnerability discovery
Cos'è
Claude Mythos è un modello di intelligenza artificiale di frontiera sviluppato da Anthropic. Si colloca in una nuova fascia di capacità al di sopra della famiglia Opus, che fino al 2026 rappresentava il livello più alto della gamma Claude. Il nome in codice interno del modello è "Capybara", mentre "Mythos" è la denominazione commerciale utilizzata per le comunicazioni esterne. Anthropic lo descrive come il modello più capace mai costruito dall'azienda, con un salto particolarmente marcato in ragionamento, coding e sicurezza informatica.
A differenza di un sistema addestrato esclusivamente per attività offensive, Mythos è un modello general-purpose le cui capacità di cybersecurity emergono da un miglioramento più ampio del ragionamento agentico, dell'analisi del codice e della pianificazione su orizzonti temporali lunghi. La caratteristica che lo ha reso noto è la capacità di individuare e sfruttare autonomamente vulnerabilità software, anche in sistemi operativi e librerie considerati tra i più robusti al mondo.
Il modello è stato annunciato inizialmente come Claude Mythos Preview l'8 aprile 2026, in concomitanza con il lancio di Project Glasswing, un'iniziativa che ne regola l'accesso. A giugno 2026 Anthropic ha ampliato la famiglia con Claude Fable 5, una versione con gli stessi pesi sottostanti ma con safeguard aggiuntivi per l'uso pubblico, e Claude Mythos 5, destinato a un accesso ancora vincolato per cybersecurity e ricerca biologica.
A cosa serve / dove eccelle
Mythos eccelle in tre aree principali: ingegneria del software, ragionamento su orizzonti lunghi e sicurezza informatica. Nelle valutazioni pubblicate da Anthropic, il modello supera consistentemente Claude Opus 4.6 su benchmark di coding come SWE-bench Verified e SWE-bench Pro, nonché su Terminal-Bench 2.0, che misura la capacità di completare compiti complessi da terminale.
Hai letto fino a qui
🤔 Hai domande su questo argomento?
Posso aiutarti a capire come applicarlo al tuo business. Scegli come vuoi parlarmi.
La caratteristica distintiva, tuttavia, è la cybersecurity avanzata. Mythos è in grado di:
analizzare codice sorgente e identificare vulnerabilità zero-day, cioè precedentemente sconosciute agli sviluppatori;
ragionare su codice macchina e binari "stripped", privi di simboli di debug;
costruire exploit funzionanti a partire da vulnerabilità note e dai relativi commit di patch;
concatenare più bug di bassa entità in catene di attacco che portano al controllo completo di un sistema.
Queste capacità lo rendono uno strumento di frontiera sia per la difesa — permettendo di trovare e correggere falle prima che vengano sfruttate — sia, potenzialmente, per attività offensive, motivo per cui Anthropic ha scelto un rilascio controllato.
Caratteristiche e specifiche
Claude Mythos Preview è stato presentato come un modello generico di nuova generazione, senza che Anthropic abbia divulgato dettagli architetturali come il numero di parametri o la composizione esatta del corpus di addestramento. Le informazioni disponibili riguardano principalmente prestazioni, accesso e governance.
Tra i dati riportati da Anthropic nel system card di Mythos Preview:
CyberGym (riproduzione di vulnerabilità): 83,1%, contro il 66,6% di Opus 4.6;
SWE-bench Verified: 93,9%, contro l'80,8% di Opus 4.6;
SWE-bench Pro: 77,8%, contro il 53,4% di Opus 4.6;
Terminal-Bench 2.0: 82,0% nella configurazione standard, fino al 92,1% con timeout esteso a quattro ore;
Humanity's Last Exam with tools: 64,7%, contro il 53,1% di Opus 4.6;
A giugno 2026, Claude Fable 5 ha portato la stessa architettura a un pubblico più ampio con un context window di 1 milione di token, output massimo di 128.000 token per richiesta e prezzi di 10 dollari per milione di token in input e 50 dollari per milione in output. Claude Mythos 5 mantiene invece accesso ristretto, con tariffazione analoga ma senza i classifier di fallback di Fable 5.
Punti di forza
Il principale punto di forza di Mythos è la capacità di scoperta autonoma di vulnerabilità complesse. Durante i test interni e i red team di Anthropic, il modello ha identificato migliaia di falle di elevata gravità in sistemi operativi e browser mainstream, tra cui:
una vulnerabilità da remoto-crash in OpenBSD rimasta nascosta per 27 anni;
un bug in FFmpeg di 16 anni, in una riga di codice sottoposta a milioni di test automatici senza essere rilevata;
una catena di vulnerabilità nel kernel Linux che permetteva l'escalation da utente standard a root.
Il modello ha dimostrato di riuscire a sviluppare exploit funzionanti in poche ore di calcolo, concatenando più primitive di basso livello. Un secondo punto di forza è la versatilità: non è uno strumento specializzato solo nella sicurezza, ma mantiene prestazioni di primo livello anche in coding generale, matematica avanzata e ragionamento scientifico. Terzo, la visione a lungo termine: Mythos sostiene compiti agentici che richiedono molti passaggi, verifica del proprio lavoro e gestione di contesti estesi.
Quando ha senso (e quando no)
Ha senso utilizzare Mythos — o la versione accessibile Fable 5 — quando il compito richiede alta autonomia, ragionamento complesso su codice o documenti di grandi dimensioni, e lavoro asincrono su orizzonti lunghi. È pertinente per team di sicurezza che devono auditarare codice legacy, per ingegneri che affrontano refactoring su larga scala, per ricercatori che analizzano grandi corpus testuali o scientifici, e per sviluppatori che costruiscono agenti software sofisticati.
Non ha senso, invece, per attività banali o ad alta frequenza dove modelli più piccoli, veloci ed economici sono sufficienti. Inoltre, la versione Mythos 5 non è disponibile per l'uso generico: l'accesso è limitato a organizzazioni verificate all'interno di programmi fidati. Anche Fable 5, pur essendo pubblica, blocca automaticamente query relative a cybersecurity offensiva, biologia, chimica e distillazione di modelli, instradandole verso Opus 4.8. Chi necessita di un controllo completo sulle capacità cyber del modello non può quindi rivolgersi alla versione consumer.
Casi d'uso concreti
I casi d'uso concreti si dividono in difensivi, produttivi e di ricerca.
Sicurezza difensiva: audit di codice sorgente e binari, ricerca di zero-day in infrastrutture critiche, red teaming automatizzato, verifica di patch e analisi post-incidente. Project Glasswing ha coinvolto partner come AWS, Apple, Cisco, CrowdStrike, Google, JPMorgan Chase, Microsoft, NVIDIA e Palo Alto Networks proprio per questi scopi.
Ingegneria del software: migrazioni su larga scala di codebase, refactoring di codice legacy, risoluzione di issue multi-file, generazione di test e documentazione tecnica. Un caso citato da Anthropic riguarda Stripe, che ha utilizzato Fable 5 per una migrazione su una codebase Ruby di 50 milioni di righe in un giorno, un'operazione stimata in due mesi di lavoro manuale per un team.
Ricerca e knowledge work: sintesi di documenti lunghi, analisi finanziaria, ragionamento su tabelle e grafici scientifici, ricerca nelle scienze della vita. Fable 5 ha ottenuto punteggi elevati su benchmark di ragionamento finanziario e analisi visiva.
Automazione agentica: compiti che richiedono ore o giorni di esecuzione autonoma, con memoria persistente e verifica intermedia dei risultati.
Alternative e contesto
Nel panorama dei modelli di frontiera, le alternative più dirette sono:
OpenAI GPT-5.4 e GPT-5.5, che hanno mostrato capacità competitive in coding e cybersecurity, con GPT-5.4-Cyber posizionato sullo stesso mercato della sicurezza;
Google Gemini 3.1 Pro, forte in ragionamento multimodale e contesti lunghi;
Claude Opus 4.7 / Opus 4.8, che rappresentano il livello immediatamente inferiore in casa Anthropic, con prestazioni più conservative in ambito cyber per scelta progettuale.
Il contesto è segnato da una corsa tra grandi laboratori AI a modelli sempre più capaci in sicurezza informatica. Anthropic ha scelto una strategia di rilascio differenziato: Fable 5 per il pubblico generale con guardie di sicurezza, Mythos 5 per partner fidati. Questo approccio riflette la consapevolezza che le stesse capacità utili a difendere sistemi critici possano essere riutilizzate per attaccarli.
Va notato che alcune valutazioni indipendenti, come quella della società di sicurezza Aisle, hanno evidenziato che modelli open-weight molto più piccoli possono talvolta replicare singoli exploit una volta noto l'obiettivo, suggerendo che il vantaggio di Mythos risieda non solo nei pesi grezzi ma anche nello scaffolding, negli strumenti e nella capacità di esplorazione autonoma dello spazio delle vulnerabilità.
In sintesi
Claude Mythos è il modello di frontiera più capace annunciato da Anthropic, con un'eccellenza particolare in cybersecurity, coding avanzato e ragionamento agentico. La sua capacità di scoprire e sfruttare autonomamente vulnerabilità software lo rende uno strumento potenzialmente trasformativo per la difesa digitale, ma anche un sistema ad alto rischio di duplice uso. Per questo Anthropic non l'ha rilasciato apertamente: la versione Mythos Preview e poi Mythos 5 restano accessibili solo a un ristretto gruppo di partner attraverso Project Glasswing, mentre il pubblico può usare Claude Fable 5, la stessa architettura con safeguard integrati. L'evoluzione di Mythos è un indicatore dello spostamento dei confini dell'autonomia artificiale in ambito software e sicurezza.