我用同樣的問題測試了5個AI模型。結果我得到了5個不同的答案。
哪個是正確的?
這不是一個修辭問題。我真的不知道。在那一刻的不確定性中——坐在那裏,面對來自五個系統的五個相互矛盾的輸出,這些系統自信地展示自己是正確的——讓我對AI目前的實際狀況有了新的認識。
---
這是場景。同樣的提示。五個領先的模型。這個問題具體到足以有一個可辯護的答案。我得到的是五個不同的結論,變化的信心水平,以及零共識。每個模型都以同樣流暢的權威展示它的輸出。沒有一個模型標記出不確定性。沒有一個模型說“這是我的推理可能會出現問題的地方。”