El 21 de enero, DeepSeek celebró el primer aniversario de DeepSeek-R1 al revelar detalles sobre su nuevo modelo, 'MODEL1.' Según BlockBeats, la compañía actualizó su código FlashMLA en GitHub, destacando 28 menciones de MODEL1 en 114 archivos. Este modelo aparece junto a V32, lo que indica que es distinto de DeepSeek-V3.2. Las diferencias en el código son evidentes en áreas como el diseño de caché KV, el manejo de la escasez y la decodificación FP8, con varias optimizaciones en la gestión de memoria.
