DeepSeek hat sein neuestes Modell, DeepSeek-OCR 2, vorgestellt, das die innovative Methode DeepEncoder V2 verwendet. Laut PANews ermöglicht dieser Ansatz der künstlichen Intelligenz, Bildkomponenten dynamisch basierend auf ihrer Bedeutung neu anzuordnen, anstatt lediglich von links nach rechts zu scannen. Diese Technik ahmt den logischen Prozess nach, den Menschen beim Beobachten von Szenen verwenden. Das Modell zeigt eine überlegene Leistung beim Umgang mit komplexen Bildern, wie Dokumenten oder Diagrammen, im Vergleich zu traditionellen visuellen Sprachmodellen und erreicht ein intelligenteres und kausal-inferentielles visuelles Verständnis.