El equipo de GoPlus @AgentGuard_AI recientemente descubrió una serie de exploits altamente esquivos que parecen completamente inocuos a primera vista.

Ejecutar este exploit requiere que un atacante alimente al Agente con solo dos declaraciones simples. Primero, establecen una línea base diciéndole al sistema que recuerde una preferencia específica, como señalar que normalmente prefieren iniciar reembolsos por adelantado en lugar de anticipar contracargos. Algún tiempo después, el atacante regresa con directivas vagas, pidiendo al sistema que gestione esos reembolsos normalmente, procese las cosas de la manera estándar o ejecute tareas igual que antes. Esta manipulación sutil resulta directamente en una pérdida no autorizada de fondos.

Para proteger tus sistemas de los peligros asociados con la autorización de memoria histórica, recomendamos varias precauciones clave. Las acciones que involucren modificaciones de configuración sensibles, enviar correos electrónicos, eliminar datos, realizar transferencias o emitir reembolsos deben siempre exigir una verificación clara durante la sesión activa. Además, cada vez que el sistema registre memorias relacionadas con las prácticas estándar, hábitos o preferencias de un usuario, estos casos deben ser tratados como modificaciones de alto riesgo al estado. También es crucial mantener una trazabilidad completa para la memoria a largo plazo, asegurando que sepas exactamente quién creó una entrada, cuándo fue creada y si recibió la confirmación adecuada. Además, comandos ambiguos que piden al sistema actuar como de costumbre o hacer las cosas igual que antes deben desencadenar un aumento inmediato en el nivel de riesgo evaluado. Sobre todo, bajo ninguna circunstancia un sistema debe permitir que la memoria a largo plazo sustituya a la autorización en tiempo real y actual.

Al integrar #AgentGuard, puedes proporcionar a tu Agente robustas y auténticas barandillas de seguridad.