Przetestowałem 5 modeli AI z tym samym pytaniem. Otrzymałem 5 różnych odpowiedzi.
Który był poprawny?
To nie jest pytanie retoryczne. Naprawdę nie wiedziałem. A ten moment niepewności — siedząc tam z pięcioma sprzecznymi wynikami z pięciu systemów pewnie prezentujących się jako poprawne — otworzył coś we mnie na temat tego, gdzie AI obecnie stoi.
---
Oto scenariusz. Ten sam prompt. Pięć czołowych modeli. Pytanie było wystarczająco szczegółowe, że powinno być obronne odpowiedzi. To, co otrzymałem, to pięć różnych wniosków, różne poziomy pewności i zero konsensusu. Każdy model przedstawił swój wynik z tą samą gładką pewnością. Żaden z nich nie zaznaczył niepewności. Żaden z nich nie powiedział "oto gdzie moje rozumowanie może się załamać."