Des données comme du pain, j'ai compris ce calcul avec OpenLedger

Parmi mes amis qui bossent dans l'IA, peu peuvent expliquer d'où proviennent réellement les données d'entraînement de leurs modèles. Ce n'est pas qu'ils ne veulent pas le dire, c'est juste qu'ils ne le savent pas. Les données, au cours de leur circulation, ont été ajoutées, supprimées, modifiées et nettoyées, leur origine est devenue méconnaissable. Les projets sur le marché qui se disent 'données décentralisées' semblent tous un peu mystiques, avec des slogans sur la mise en chaîne des données, la protection des droits d'auteur et le partage automatique des profits, criés à tout va. Mais si tu regardes leurs dépôts de code, beaucoup n'ont même pas réussi à faire tourner un nœud de validation correct.
La semaine dernière, je me suis ennuyé et je suis tombé sur des gens qui critiquaient le fait que le déploiement des nœuds du testnet d'OpenLedger ait un seuil d'entrée trop élevé, avec des exigences techniques assez strictes, rendant la tâche difficile pour les joueurs ordinaires. À ce moment-là, je me suis dit qu'un seuil élevé signifie que ce n'est pas un jeu. J'ai ensuite parcouru deux fois de suite la documentation de leur site officiel, la page d'économie des tokens, ainsi que l'annonce de leur partenariat avec Chainbase. Quelques chiffres m'ont fait m'asseoir et faire le calcul sérieusement.
Commençons par le testnet. Les données publiées sur la page officielle sont les suivantes : le nombre de nœuds enregistrés dépasse 6 millions, ce n'est pas 600, mais 6 millions. Un total de 25 millions de transactions a été traité, et 27 produits basés sur l'IA ont été lancés. Ces 25 millions de transactions ne sont pas le genre de 'transactions de test' générées par des airdrops, mais de véritables demandes commerciales sur la chaîne, attestant l'attribution et appelant des modèles. Ce volume, dans le secteur des infrastructures de données sur blockchain, n'est déjà pas négligeable.
Ensuite, parlons des tokens. L'offre totale est de 1 milliard de tokens, lors du TGE, 21,55 % ont été libérés pour circulation. L'équipe et les investisseurs ont un verrouillage de 12 mois, suivi d'un déverrouillage linéaire sur 36 mois, avec 5,08 millions de tokens pour les investisseurs chaque mois et 4,16 millions pour l'équipe. Mais ce qui me semble vraiment important à surveiller, c'est la 'répartition communautaire et écologique', qui représente 61,71 % du total, libérée linéairement depuis le premier jour du TGE, pour un total de 381,6 millions de tokens. Cette partie est destinée à récompenser les contributeurs de données et les entraîneurs de modèles. Théoriquement, tant que vous téléchargez des données précieuses sur Datanet ou aidez à valider des données pour d'autres, vous devriez pouvoir recevoir $OPEN . Mais le problème est qu’actuellement, l’officiel n’a pas publié un tableau de bord de données en chaîne en temps réel montrant un 'classement de contribution Datanet' ou 'combien de tokens ont été libérés chaque mois et combien ont été réellement distribués'. Cela signifie que vous savez qu'il y a 381 millions de tokens dans le pool, mais vous ne savez pas combien arrivent vraiment chez les contributeurs chaque mois. Ce manque d'information me semble digne d'être surveillé.
En ce qui concerne la technologie, leur système de preuve d'attribution n'est pas une simple preuve de hachage. La documentation technique officielle indique qu'ils utilisent la méthode Infini gram avec un tableau de suffixes, permettant de retrouver le fragment original le plus proche dans les données d'entraînement lorsqu'un grand modèle produit une certaine phrase. C'est en fait un problème hardcore. Les données d'entraînement de grands modèles peuvent dépasser les milliers de milliards de tokens, et trouver la source en temps réel implique un calcul énorme. Les données fournies par l'officiel indiquent que sur le jeu de données 'Red Pajamas' de 1,4 trillion de tokens, toute requête de n-uplets ne prend que 20 millisecondes, avec un coût de stockage d'environ 7 octets par token. Je ne peux pas vérifier ce chiffre, mais si cela fonctionne réellement à grande échelle de manière stable, cela pourrait effectivement résoudre le problème de la 'données de mauvaise qualité' utilisées par l'IA.
Mais je dois dire la vérité. En ce qui concerne la manière dont les nœuds de validation se protègent contre les abus, comme le fait de délibérément faire fuiter ou de rejeter des transactions, je n'ai trouvé dans la documentation officielle que des descriptions sur la mise en jeu d'OPEN pour participer à la gouvernance du réseau, liant les revenus au taux de disponibilité et à l'exactitude de validation. Je n'ai pas vu un ensemble complet de règles procédurales 'défi-arbitrage-punition' dans la documentation publique. Ce n'est pas que cela n'existe pas ; peut-être que je ne l'ai pas trouvé, ou peut-être qu'ils l'ont écrit dans un autre livre blanc technique, mais cette partie est actuellement opaque pour moi.
D'ailleurs, concernant la date de lancement du mainnet, j'ai vu deux déclarations publiques. L'une provient d'un article approfondi de Gate.io, affirmant que le mainnet sera officiellement lancé en septembre 2025. L'autre provient d'un rapport de The Block, indiquant que le mainnet OPEN sera lancé en novembre 2025. Honnêtement, cette incohérence temporelle est assez courante dans les projets Web3 ; il est possible que septembre soit le lancement technique du mainnet, tandis que novembre soit l'ouverture officielle des échanges et de l'écosystème. Personnellement, je préfère me baser sur les annonces officielles, mais je ne vois pas de titre accrocheur sur la page d'annonce officielle indiquant clairement la date de lancement du mainnet, donc je les liste tous les deux et vous jugez par vous-même.
Une autre chose que je pense qu'il vaut la peine de mentionner. Le 18 décembre 2025, OpenLedger a publié une annonce concernant une collaboration avec Chainbase, ce n'est pas juste un logo collé là. Chainbase intègre des données structurées multichaînes dans OpenLedger, puis chaque donnée est étiquetée avec une preuve d'attribution. Le blog officiel le dit clairement : le réseau Hyperdata de Chainbase transforme les événements originaux sur la chaîne en données structurées pouvant être directement utilisées par l'IA, et la preuve d'attribution d'OpenLedger enregistre chaque accès et chaque inférence de ces données, formant une chaîne vérifiable complète. Cela signifie que lorsque vous créez un agent IA, les données sur la chaîne qu'il utilise peuvent être retracées jusqu'à leurs contributeurs originaux, et après utilisation, cela peut automatiquement rémunérer les contributeurs. Ce cycle, s'il fonctionne, est beaucoup plus crédible que de simplement clamer la 'propriété des données'. Après l'annonce, les médias blockchain BlockchainReporter et Phemex ont également suivi le 19, montrant que cette collaboration a suscité un certain intérêt dans l'industrie.
Je ne suis pas en train de dire que ce projet est incroyable maintenant. 6 millions de nœuds enregistrés, 25 millions de transactions, 27 produits d'IA, ces chiffres semblent bons, mais il faut les comparer. Par rapport à ces projets meme qui n'ont que quelques centaines de milliers d'adresses après avoir sorti un token, ces données sont solides. Mais en comparaison avec l'échelle de données d'entraînement dont les grands acteurs de l'IA ont réellement besoin, il y a encore plusieurs ordres de grandeur de différence. La pression de la libération des tokens, la transparence des mécanismes de protection contre les abus des nœuds, la visualisation de la contribution réelle de Datanet, ce sont tous des points faibles visibles en ce moment.
Je vais continuer à surveiller deux choses : d'une part, combien d'OPEN le pool d'écosystème communautaire libère réellement chaque mois et combien est effectivement distribué, et d'autre part, la fréquence d'appel et le temps de réponse du système de preuve d'attribution dans des scénarios réels. Quant au prix de $OPEN , honnêtement, je ne regarde pas les chandeliers, vous jugez par vous-même.
#OpenLedger @OpenLedger $OPEN #openleder 
OPEN
0.1943
-1.81%