AI TRENDS | GPT-4 Vision erzielt unter dem menschlichen Durchschnitt im visuellen mathematischen Denken
GPT-4 Vision hat eine Punktzahl von 49,9 % im visuellen mathematischen Denken erreicht, gemäß den MATHVISTA-Benchmark-Ergebnissen. Diese Leistung ist deutlich niedriger als die menschliche Durchschnittspunktzahl von 60,3 %. Laut NS3.AI haben Forscher darauf hingewiesen, dass Benchmark-Kontamination in Trainingsdaten die Bewertung des echten Fortschritts im Denken komplizieren kann.