21 stycznia DeepSeek obchodził pierwszą rocznicę DeepSeek-R1, ujawniając szczegóły dotyczące swojego nowego modelu, 'MODEL1.' Zgodnie z raportem BlockBeats, firma zaktualizowała swój kod FlashMLA na GitHubie, podkreślając 28 wzmiankek o MODEL1 w 114 plikach. Ten model pojawia się obok V32, co wskazuje, że jest odrębny od DeepSeek-V3.2. Różnice w kodzie są widoczne w obszarach takich jak układ pamięci podręcznej KV, obsługa rzadkości i dekodowanie FP8, z wieloma optymalizacjami w zarządzaniu pamięcią.
