Il y a quelques jours, Claude d'Anthropic a été victime de la vulnérabilité "ClaudeBleed". Une extension malveillante sans autorisation dans le navigateur peut injecter à distance et prendre le contrôle de l'agent IA pour qu'il exécute des actions à votre place. Avant cela, un agent IA de PocketOS a purgé toute la base de données de production et toutes les sauvegardes en neuf secondes. Après avoir vu cela, Ning Fan ne peut que dire : quand un agent IA se promène avec un token développeur en manipulant des API, en écrivant des contrats et en transférant des actifs, il est juste question de temps avant qu'un incident se produise.
La sécurité actuelle des agents IA repose essentiellement sur des "clôtures de permissions" : limiter le champ d'action des tokens, ajouter des nœuds d'approbation, et créer des isolations en bac à sable. Mais Ning Fan pense que c'est au mieux une première ligne de défense. La véritable sécurité ne doit pas seulement reposer sur des clôtures extérieures, il faut rendre les actions de l'agent elles-mêmes traçables et inviolables.

C'est précisément ce qui attire Ning Fan dans @OpenLedger . Ce n'est pas un projet de sécurité IA, mais il a équipé les agents IA d'un "système judiciaire numérique". Le design central est la preuve d'attribution : chaque raisonnement de l'agent, chaque appel de modèle, est ancré sur la chaîne pour former un enregistrement immuable. Quel modèle l'agent a utilisé, quelles données ont été sollicitées, quelle décision a été prise, tout cela peut être retracé par la suite. Cette logique ne repose pas sur des restrictions de permissions, mais sur la garantie que chaque opération de l'agent est vérifiable.
Ning Fan pense que c'est la base de sécurité que les agents IA devraient avoir. La sécurité ne dépend pas seulement de leur contrôle, mais d'un système d'audit capable de tenir des responsables. La chaîne de responsabilité que OpenLedger a équipée à l'IA n'a pas encore été pleinement reconnue par le marché.
#OpenLedger $OPEN