🚬 Un nouveau benchmark nof1.ai est apparu, oĂč diffĂ©rents LLM Ă©changent des cryptomonnaies pour de rĂ©els $10 000, afin de tester l'intellect sur les marchĂ©s.

En réalité, l'expérience semble absurde : les modÚles sans nouvelles et contexte effectuent des transactions aléatoires dans l'environnement le plus volatil.

Les rĂ©sultats ne montrent rien, #Grok 4 est en tĂȘte simplement parce qu'il ne commerce pas — c'est peut-ĂȘtre le seul signe d'un vĂ©ritable intellect.

UPD : #DeepSeek s'est hissĂ© en tĂȘte.