Pada 21 Januari, DeepSeek merayakan ulang tahun pertama DeepSeek-R1 dengan mengungkapkan rincian tentang model barunya, 'MODEL1.' Menurut BlockBeats, perusahaan memperbarui kode FlashMLA-nya di GitHub, menyoroti 28 penyebutan MODEL1 di 114 file. Model ini muncul bersama V32, menunjukkan bahwa model ini berbeda dari DeepSeek-V3.2. Perbedaan dalam kode dapat dilihat di area seperti tata letak cache KV, penanganan sparsitas, dan dekoding FP8, dengan beberapa optimisasi dalam manajemen memori.
