Il DeepSeek della Cina ha lanciato nuovi modelli di intelligenza artificiale, DeepSeek-V3.2 e DeepSeek-V3.2-Speciale, che rivaleggiano o eguagliano le prestazioni di Gemini 3 Pro di Google e GPT-5 di OpenAI in vari benchmark. Questi nuovi modelli della startup cinese sono open source e hanno generato un significativo dibattito all'interno della comunità AI.
DeepSeek-V3.2-Speciale ha dimostrato capacità di ragionamento pari a quelle di Gemini 3 Pro di Google. Il modello di base, DeepSeek-V3.2, ha performato al livello di GPT-5 di OpenAI. Nota bene, DeepSeek-V3.2-Speciale ha raggiunto prestazioni da medaglia d'oro nel test delle Olimpiadi matematiche internazionali, un risultato precedentemente raggiunto solo da modelli interni e non pubblici di OpenAI e Google DeepMind.
Nonostante l'accesso limitato a chip semiconduttori avanzati, DeepSeek ha raggiunto questi avanzamenti concentrandosi su uno sviluppo più intelligente piuttosto che unicamente su una potenza di calcolo massiccia. DeepSeek utilizza un'architettura Mixture-of-Experts (MoE), che consente di attivare solo le parti necessarie del modello per compiti specifici, rendendolo computazionalmente efficiente. Questo approccio permette a DeepSeek di raggiungere capacità AI all'avanguardia a una frazione del budget computazionale rispetto ad alcuni dei suoi concorrenti.
Susan Zhang, ingegnere di ricerca principale presso Google DeepMind, ha riconosciuto il lavoro di DeepSeek, lodando in particolare i loro dettagliati rapporti tecnici e gli sforzi nella stabilizzazione del modello e nel potenziamento delle capacità agentiche. Mentre gli ultimi modelli di DeepSeek mostrano prestazioni impressionanti, l'azienda riconosce che i modelli proprietari closed-source sono progrediti più rapidamente e che affrontano ancora sfide in termini di efficienza dei token e ampiezza della conoscenza mondiale rispetto ai modelli proprietari leader.