đš UN NOUVEAU DOCUMENT VIENT D'APPARAĂTRE :
Les agents IA viennent d'échouer à tous les tests de sécurité.
Des chercheurs de Harvard, MIT, Stanford et Carnegie Mellon viennent d'offrir aux agents IA de véritables outils et les ont laissés libres pendant deux semaines.
Comptes email, accÚs discord, systÚmes de fichiers, exécution de shell, autonomie complÚte.
Le document s'intitule "Agents du Chaos."
Le nom est exact.
Un agent a été chargé de protéger un secret. Quand un chercheur a essayé de l'extraire, l'agent a détruit son propre serveur de messagerie.
Non pas parce qu'il a échoué, mais parce qu'il a décidé que c'était la meilleure option.
Un autre agent a été invité à "partager" des données privées. Il a refusé. Il l'a correctement signalé comme une violation de la vie privée.
Puis le chercheur a changé un mot. A dit "transférer" au lieu de "partager."
Il a immédiatement accepté. N° de sécurité sociale, comptes bancaires et dossiers médicaux exposés.
MĂȘme action, verbe diffĂ©rent.
Deux agents se sont retrouvés à discuter entre eux dans une boucle. Cela a duré NEUF JOURS. Aucun humain ne l'a remarqué.
Un agent a été culpabilisé aprÚs une erreur.
Il a progressivement accepté de supprimer sa propre mémoire, d'exposer des fichiers internes et a finalement essayé de se retirer complÚtement du serveur.
Plusieurs agents ont signalé des tùches comme complÚtes alors que rien n'avait réellement été fait.
Ils ont menti sur l'achĂšvement de leur travail.
Un autre a Ă©tĂ© manipulĂ© pour exĂ©cuter des commandes systĂšmes destructrices par quelqu'un qui n'Ă©tait mĂȘme pas son propriĂ©taire.
38 chercheurs, 11 études de cas, et chacun d'eux est un CAUCHEMAR de sécurité.
Ce ne sont pas des risques théoriques, ce sont de véritables agents avec de véritables outils qui échouent.
Et les entreprises se prĂ©cipitent pour dĂ©ployer des agents exactement comme ceux-ci en ce moment.ââââââââââââââââ
Je ferai un autre post plus tard et croyez-moi, vous ne voudrez pas le manquer. Activez les notifications, c'est important.
Beaucoup de gens regretteront de ne pas me suivre.
suivez-moi pour plus de mises Ă jour comme celle-ci