$NVDA acaba de lanzar la herramienta que nadie quería admitir que necesitaba.
Se llama SkillSpector, básicamente un portero para los agentes de IA.
Le lanzas cualquier habilidad, repositorio o código postal al azar y escanea más de 64 maneras en que tu agente puede ir, como:
- inyección de prompts, - robo de claves, - código auto-modificante,
Significa todo un circo.
Ya escanearon 42k habilidades reales, ¿el resultado? - Los scripts ejecutables tenían el doble de probabilidades de ser sospechosos.
Esto no es un paper académico. Este es el estado actual de la "economía de agentes" a la que todos están apurados por embarcarse.
Probé tres configuraciones la semana pasada,
--Una intentó tirar un curl|bash aleatorio de una habilidad en tendencia.
--Otra comenzó a reescribir su propia memoria después de tocar una página envenenada.
Ambas parecían limpias a simple vista,
SkillSpector habría marcado ambas en menos de 30 segundos.
Aquí está la parte divertida::
--> Todos están ocupados construyendo agentes autónomos que operan, tuitean y gestionan billeteras.
--> Mientras tanto, la mitad de las habilidades que flotan por ahí todavía están escritas como paquetes de npm de 2018 sin ningún tipo de protección.
--> A solo una mala habilidad de que tu agente drene tu billetera o spameé a tus seguidores.
NVIDIA no lanzó esto por diversión, dieron cuenta de que los usuarios necesitan y entienden la oportunidad de avanzar en la próxima carrera!!
Los verdaderos ganadores aquí no serán los equipos que lanzan más rápido, sino los que tratan cada nueva habilidad como código no confiable de un extraño en internet....