#OPENCLAW Un phénomène exceptionnel, l'Agent a atteint un tournant, la consommation de Token ne fera que croître.

Le plus grand facteur cette année est l'IA qui doit prouver si c'est une bulle, si l'évaluation des actions américaines est trop élevée.

J'ai rassemblé quelques données et rapports.

Selon le calcul de l'API OpenAI, environ 1,8 à 2,2 millions de milliards de Token ont été traités en 2025.

Pour les deux premiers mois de 2026, l'estimation de l'API OpenAI : environ 520 millions de milliards de Token.

En deux mois, environ 1/4 de la quantité de 2025 a été complété.

Ce ne sont que les données d'OpenAI, sans tenir compte de l'ensemble de l'industrie. Les modèles nationaux consomment encore plus, avec un rapport qualité-prix plus abordable.

La pente de consommation actuelle signifie que la consommation de Token pour l'année 2026 est très susceptible de dépasser la somme totale de toutes les années de la civilisation humaine précédentes.

La demande pour 2026 est de plusieurs fois celle de 2025, et pour 2027 ? Certains fournisseurs ont déjà augmenté les prix de l'API et limitent le flux, continuant à manquer de cartes, d'électricité et de tokens.

Selon les rapports financiers de l'industrie de fin 2025 à début 2026 (comme les données internes divulguées d'OpenAI et la description du financement de la série G d'Anthropic) :

Marge brute (Compute Margin) : environ 60 % - 75 %
Définition : seulement les coûts de calcul nécessaires pour l'inférence (GPU, électricité, maintenance des serveurs).
État actuel : à titre d'exemple, pour OpenAI, sa marge brute de calcul en octobre 2025 a déjà atteint 70 % (alors qu'au début de 2024, elle n'était que de 35 %). Cela signifie que pour 100 yuans payés par les utilisateurs, le coût pur de calcul est d'environ 30 yuans.

Marge brute des affaires (Gross Margin) : environ 30 % - 50 %
Définition : sur la base de la marge brute de calcul, après avoir déduit les coûts de formation des modèles (amortissement des calculs), les salaires des techniciens, la révision du contenu, etc.
État actuel : c'est un indicateur assez difficile. La marge brute d'OpenAI pour l'année 2025 est d'environ 33 %, car d'énormes investissements en R&D et la concurrence pour les talents diluent le profit par Token.

Changement clé : avec la généralisation de NVIDIA B200 (Blackwell) en 2026, le débit d'inférence par Token a augmenté de près de 5 fois, entraînant une augmentation de la marge brute de calcul d'un « équilibre » l'année dernière à maintenant une « haute marge ».
#ai