🚬 Un nouveau benchmark nof1.ai est apparu, où différents LL

🚬 Un nouveau benchmark nof1.ai est apparu, où différents LLM échangent des cryptomonnaies pour de réels $10 000, afin de tester l'intellect sur les marchés. 
En réalité, l'expérience semble absurde : les modèles sans nouvelles et contexte effectuent des transactions aléatoires dans l'environnement le plus volatil. 
Les résultats ne montrent rien, #Grok   4 est en tête simplement parce qu'il ne commerce pas — c'est peut-être le seul signe d'un véritable intellect.
UPD : #DeepSeek   s'est hissé en tête.

.css-1iqe90x{box-sizing:border-box;margin:0;min-width:0;color:#EAECEF;}🚬 Un nouveau benchmark nof1.ai est apparu, où différents LLM échangent des cryptomonnaies pour de réels $10 000, afin de tester l'intellect sur les marchés.

🚬 Un nouveau benchmark nof1.ai est apparu, où différents LLM échangent des cryptomonnaies pour de réels $10 000, afin de tester l'intellect sur les marchés.