Les chercheurs : Les agents IA doivent être considérés comme des systèmes crypto non fiables

Un nouveau document de recherche recontextualise la sécurité pour les agents alimentés par l'IA comme un problème systémique, soutenant que les protections doivent s'étendre au-delà du modèle lui-même pour renforcer l'ensemble du flux de travail. Publié sous une forme amendée le 20 mai par des chercheurs de Google, Gray Swan AI, EmbraceTheRed, et plusieurs universités, le travail soutient que les agents IA doivent être considérés comme des composants non fiables au sein d'une architecture de sécurité plus large, avertissant que se concentrer uniquement sur la robustesse du modèle laisse les écosystèmes vulnérables aux attaques et aux pannes.
« Dans ce but, nous proposons de considérer la sécurité des agents comme une instance de la sécurité informatique. Ce domaine a depuis longtemps affaire à des attaquants puissants et a motivé des décennies de recherche sur des principes et des techniques qui traitent de tels adversaires », ont écrit les chercheurs dans le document. Ce cadre déplace l'accent de la simple rigidité du fonctionnement interne d'un agent à la protection de l'ensemble de la chaîne – des entrées de données et des instructions aux autorisations que détient l'agent et aux destinations que les données peuvent atteindre. Les auteurs soutiennent que cette approche orientée systèmes est particulièrement pertinente à mesure que les agents IA deviennent plus intégrés dans les applications crypto, y compris le trading autonome et les interactions avec les portefeuilles.
« À travers ce prisme, les efforts pour accroître la robustesse des modèles, le point de vue dominant dans la communauté, sont insuffisants à eux seuls. Au lieu de cela, nous devons compléter les efforts existants avec des techniques du domaine de la sécurité des systèmes. »
Le document note que les agents IA gagnent déjà en traction parmi les utilisateurs de crypto, avec des dirigeants de l'industrie spéculant sur une adoption rapide. Le PDG de Circle, Jeremy Allaire, par exemple, a projeté que des milliards d'agents IA pourraient opérer au nom des utilisateurs dans cinq ans, soulignant la rapidité à laquelle les outils autonomes pourraient devenir un élément standard des flux de travail crypto.
Points clés à retenir
La sécurité pour les agents IA doit traiter l'agent comme un composant non fiable au sein d'un système plus large, et non comme un module fiable et isolé.
Trois mécanismes pourraient bloquer une grande partie des attaques : distinguer entre instructions et données non fiables, accorder uniquement les permissions minimales nécessaires, et contrôler les flux de données pour prévenir les fuites vers des destinations non sûres.
Les incidents du monde réel, y compris les bots de trading crypto et les interfaces de portefeuille, illustrent comment un attaquant pourrait exploiter des outils alimentés par l'IA si des mesures de sécurité globales ne sont pas en place.
Dans le monde crypto, des agents IA sont utilisés pour construire des applications, automatiser des trades, et interagir avec des protocoles, augmentant les enjeux pour une conception de sécurité robuste de bout en bout.
Les voix de l'industrie plaident en faveur de prompts contextuels et isolés et d'une gouvernance rigoureuse autour des actions qu'un agent IA peut effectuer, surtout lorsque des portefeuilles ou des clés privées sont impliqués.
La sécurité comme un problème de systèmes pour les agents IA
L'argument central du document amendé est que l'intégration de la sécurité uniquement dans la robustesse du modèle IA est insuffisante. Au lieu de cela, les agents IA devraient être conçus et opérés comme des composants au sein d'un système plus large et défendu. Les chercheurs soulignent que la pratique de sécurité standard distingue entre composants fiables et non fiables, et l'IA devrait être traitée comme non fiable par conception. En faisant cela, les défenseurs peuvent appliquer des décennies d'aperçus de sécurité informatique aux arguments concernant les modèles de menaces, les adversaires, et la défense en profondeur.
Dans le cadre de ce cadre, les auteurs décrivent trois mécanismes qui pourraient éliminer une grande partie des attaques potentielles. Tout d'abord, il doit y avoir une séparation claire entre les instructions données à un agent et les données que l'agent traite. En empêchant les adversaires d'incorporer des instructions malveillantes au sein de données apparemment innocentes, les agents deviennent plus difficiles à tromper via une manipulation basée sur les données. Deuxièmement, les agents devraient fonctionner avec l'ensemble minimum de permissions nécessaires pour une tâche, réduisant la portée d'impact si un attaquant compromet l'agent. Troisièmement, le système plus large devrait régir les flux d'informations sensibles, restreignant où les données peuvent voyager et s'assurant que l'agent ne peut pas exfiltrer ou rediriger des données vers des destinations non sûres.
L'accent mis par le document sur la gestion des données et la discipline des autorisations s'aligne avec des principes de sécurité établis utilisés pour gérer les risques dans d'autres domaines. En résumé, même un agent IA hautement capable peut être sûr si les contrôles du système environnant sont robustes et bien définis, et si la capacité de l'agent à agir est soigneusement limitée.
Tensions du monde réel en crypto : incidents et modèles de conception
La discussion se déroule dans un contexte d'incidents du monde réel impliquant des outils crypto alimentés par l'IA. En mai, l'assistant de trading alimenté par l'IA Bankr aurait désactivé des transactions après qu'un attaquant ait eu accès à au moins 14 portefeuilles, un développement que des chercheurs en sécurité ont lié à un abus potentiel du bot. Bien que le mécanisme exact de compromission reste en discussion, cet épisode souligne la surface de vulnérabilité lorsque les agents se voient accorder le contrôle opérationnel sur des portefeuilles ou des actions de trading.
Les voix de l'industrie soulignent que le risque n'est pas théorique. Alors que les plateformes crypto expérimentent avec des agents IA pour des tâches telles que la détection de front-running, l'audit de contrats, les vérifications de solde, et même les paiements automatisés, le potentiel de dommages systémiques augmente si la sécurité n'est pas intégrée dans l'ensemble du cycle de vie - ingestion des données, logique de décision, et contrôles d'exécution.
Aaron Ratcliff, responsable de l'attribution chez Merkle Science, a souligné le paradoxe d'intégrer l'IA dans des écosystèmes sans confiance. Il a déclaré à Cointelegraph que donner accès à un agent à un portefeuille peut être sûr si le système impose des frontières et une vérification strictes. « Je voudrais une preuve que l'IA peut détecter les front-runs, appliquer des limites de glissement, repérer des tokens frauduleux, et auditer des contrats en temps réel avant qu'elle ne réalise un trade. Elle devrait également isoler les prompts, prévenir les injections, et bloquer l'accès de type homme du milieu », a-t-il dit.
Sean Ren, co-fondateur de Sahara AI, a convenu que les protocoles de contexte des modèles jouent un rôle crucial dans la sécurité lorsqu'ils sont configurés correctement. Cependant, il a mis en garde que les utilisateurs doivent rester vigilants sur chaque action qu'un agent IA effectue. « Ils agissent essentiellement comme un gardien entre le modèle IA et votre portefeuille. L'agent ne peut effectuer que des actions spécifiques et approuvées - comme vérifier des soldes ou préparer un paiement que vous devez confirmer - plutôt que de déplacer librement des fonds ou de modifier les paramètres du portefeuille », a noté Ren.
Implications pour les développeurs et les utilisateurs de Web3
Le cadre de sécurité des systèmes de l'étude a des implications pratiques pour les développeurs construisant des applications Web3 alimentées par l'IA. Il suggère un changement d'architecture vers une autorisation explicite, une provenance des données vérifiable, et des flux de données imposés qui séparent la prise de décision de l'agent du contrôle du portefeuille. Pour les utilisateurs, le message est un mélange d'optimisme prudent : les agents IA peuvent débloquer une automatisation pratique et des interactions plus rapides avec les protocoles DeFi, mais uniquement dans un design qui limite le risque par la séparation des devoirs, le sandboxing, et une surveillance robuste.
Alors que les plateformes crypto explorent de plus en plus des assistants alimentés par l'IA, le débat est susceptible de passer de « pouvons-nous automatiser davantage ? » à « comment pouvons-nous le faire en toute sécurité ? » L'accent mis sur le traitement des agents comme des composants non fiables pourrait conduire à des examens de sécurité plus rigoureux, des protocoles de contexte normalisés, et une plus grande emphase sur la gouvernance des prompts et les défenses contre les injections de prompts dans les systèmes de production.
Les chercheurs de la collaboration soulignent également un élan plus large dans l'industrie. L'adoption d'agents IA dans les outils crypto - allant de l'automatisation du trading à des vérifications de risque proactives et à l'analyse de contrats - pourrait s'accélérer si les bâtisseurs adoptent un cadre de sécurité partagé qui reflète les pratiques établies en matière de sécurité informatique. Le résultat pourrait être un écosystème crypto qui exploite les gains de productivité de l'IA tout en maintenant de fortes protections contre la manipulation, les fuites et les actions involontaires.
En regardant vers l'avenir, les auteurs de l'étude plaident pour des étapes pratiques que les échanges, les fournisseurs de portefeuilles et les développeurs DeFi peuvent prendre dès maintenant. Cela inclut l'application d'une séparation stricte des instructions et des données, l'application du principe du moindre privilège, et la mise en œuvre de contrôles au niveau du système qui régissent où les informations peuvent aller. L'objectif global est d'incorporer une mentalité de défense en profondeur qui évolue avec des agents IA de plus en plus autonomes, plutôt que de compter uniquement sur le renforcement du modèle.
Pour les lecteurs surveillant la convergence de l'IA et de la crypto, le message clé est clair : à mesure que les agents autonomes deviennent plus capables, les principes de conception régissant leur fonctionnement doivent évoluer. Le domaine se dirige vers un paradigme de sécurité holistique qui traite les agents comme des composants au sein d'un système plus large et défendable, avec des conséquences qui touchent les portefeuilles, les bots de trading et l'automatisation sur chaîne. Les prochains trimestres devraient révéler si l'industrie peut traduire cette philosophie de sécurité des systèmes en normes concrètes, en paramètres par défaut plus sûrs et en garanties vérifiables pour les utilisateurs finaux.
Cet article a été publié à l'origine sous le titre : Chercheurs : Les agents IA doivent être traités comme des systèmes crypto non fiables sur Crypto Breaking News – votre source de confiance pour les nouvelles crypto, les nouvelles Bitcoin et les mises à jour blockchain.