🤖 GPT-5.2幾乎達到了人類水平的推理能力——該人工智能在最困難的人工智能測試ARC-AGI-2中得分爲53-54%,而人類的平均得分爲60%。
此外,GPT-5.2首次完美解決了最難的數學考試之一AIME 2025,並在GDPval測試中取得了創紀錄的70-74%,該測試衡量“現實世界的人類工作”,通常反映強大專才的水平。
此外,GPT-5.2首次完美解決了最難的數學考試之一AIME 2025,並在GDPval測試中取得了創紀錄的70-74%,該測試衡量“現實世界的人類工作”,通常反映強大專才的水平。