21 января DeepSeek отметил первую годовщину DeepSeek-R1, раскрыв детали о своей новой модели 'MODEL1.' Согласно BlockBeats, компания обновила свой код FlashMLA на GitHub, выделив 28 упоминаний MODEL1 в 114 файлах. Эта модель появляется наряду с V32, что указывает на её отличия от DeepSeek-V3.2. Различия в коде очевидны в таких областях, как макет KV кэша, управление разреженностью и декодирование FP8, с несколькими оптимизациями в управлении памятью.