Riesgos de Seguridad en IA

A partir de abril de 2026, Anthropic está investigando informes de acceso no autorizado a su altamente sensible modelo de IA "Mythos", una situación que ha generado una gran alarma dentro de los sectores de tecnología y criptomonedas. La brecha involucra un modelo capaz de explotación autónoma de ciberseguridad, lo que ha llevado a temores de que sus capacidades puedan ser mal utilizadas, particularmente en la identificación de vulnerabilidades en sistemas de finanzas descentralizadas (DeFi).
El Incidente Central: Preocupaciones de Seguridad sobre "Mythos"
El Modelo ("Mythos"): Anthropic desarrolló un modelo avanzado, bajo el nombre en clave "Mythos" (o Capybara), diseñado para encontrar y parchear vulnerabilidades en el software de manera autónoma, representando una potencial "arma de doble filo" en la defensa y ataque cibernético.
La Brecha/Acceso No Autorizado (Abril 2026): Informes indican que usuarios no autorizados obtuvieron acceso al modelo restringido de Mythos, no a través de un hackeo directo de la infraestructura central de Anthropic, sino mediante credenciales comprometidas de un contratista externo.
Mecanismo de Acceso: La brecha fue facilitada por información de una filtración de datos separada en Mercor, un proveedor de datos de entrenamiento de IA.
Alcance: Anthropic ha confirmado que está investigando los informes, manteniendo que no hay evidencia de que sus propios sistemas hayan sido violados directamente, sino que un "entorno de proveedor externo" fue comprometido.
Impacto en los Sectores de Tecnología y Cripto
El incidente "Mythos" ha causado una preocupación generalizada debido a las capacidades automatizadas de alto nivel del modelo:
Explotación Autónoma: Se informa que Mythos es capaz de identificar vulnerabilidades de día cero (fallos desconocidos previamente) en sistemas operativos y software principales.
Riesgos de Software No Actualizado: Anthropic advirtió que el modelo identificó miles de vulnerabilidades que permanecen sin parchear, proporcionando un posible mapa para los hackers.
Preocupaciones en Cripto y Finanzas: La capacidad de una IA para escanear y identificar rápidamente brechas de seguridad podría permitir a los atacantes apuntar a protocolos DeFi, contratos inteligentes y otra infraestructura financiera a velocidades sin precedentes.
Impacto en el Mercado de Ciberseguridad: La revelación de las capacidades de Mythos causó una fuerte caída en las acciones de ciberseguridad en febrero y abril de 2026, ya que los inversores temen que las empresas de seguridad tradicionales se vuelvan obsoletas si la IA puede manejar tareas defensivas y ofensivas.
Respuesta de Anthropic
Lanzamiento Restringido: Debido a los graves riesgos, Anthropic no lanzó Mythos públicamente, manteniéndolo en un piloto cerrado con un número limitado de "organizaciones evaluadas", como grandes empresas de tecnología y seguridad.
Proyecto Glasswing: Anthropic lanzó "Proyecto Glasswing" para permitir que organizaciones evaluadas utilicen Mythos con fines defensivos, respaldado por $100 millones en créditos de uso.
Investigación: La empresa está investigando activamente la brecha de seguridad del proveedor para mitigar el acceso no autorizado.
Contexto General: Múltiples Incidentes de 2026
Este incidente sigue a una serie de lapsos de seguridad a principios de 2026:
Filtración CMS de marzo de 2026: Anthropic dejó accidentalmente miles de documentos internos accesibles públicamente, revelando detalles sobre el modelo Mythos.
Filtración de Código de marzo de 2026: Anthropic liberó accidentalmente el código fuente de su herramienta "Claude Code", lo que los expertos advirtieron que podría ayudar a los hackers a mapear el "arnés agente" de la IA para crear "puertas traseras" en los sistemas de IA.
Estos eventos han desencadenado un aumento en la vigilancia por parte de gobiernos y sectores financieros respecto a la seguridad de las cadenas de suministro de IA.
#AISecurity