Desde el primer test, ingenieros de Anthropic observaron que Mythos Preview supera a modelos anteriores en una capacidad específica y delicada: identificar y explotar de forma autónoma vulnerabilidades zero-day, es decir, fallos de seguridad desconocidos, en los principales sistemas operativos y navegadores web del mundo.
El ejemplo más elocuente que la compañía compartió en su blog es el de OpenBSD, considerada una de las plataformas más seguras del mercado: Mythos localizó una vulnerabilidad que había permanecido oculta durante 27 años.
El temor de Anthropic es directo: si esta tecnología estuviera disponible para el público en general, ciberdelincuentes podrían aprovecharla para comprometer infraestructuras críticas a escala global. Para mitigar ese riesgo, la compañía limitó el acceso al modelo a través del llamado Proyecto Glasswing, un programa que reúne a socios estratégicos como AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Fundación Linux, Microsoft, NVIDIA y Palo Alto Networks.
El objetivo es que estas organizaciones usen la IA de forma defensiva: encontrar y corregir vulnerabilidades antes de que actores maliciosos puedan explotarlas. “El proyecto Glasswing representa un paso importante para brindar a los defensores una ventaja duradera en la próxima era de la ciberseguridad impulsada por la IA”, señaló Anthropic en un comunicado.
En términos de rendimiento, el informe técnico de Anthropic indica que Mythos Preview supera a modelos como GPT 5.4, Gemini 3.1 Pro y Claude Opus 4.6 en la mayoría de los benchmarks. En pruebas de resolución matemática como USAMO, el modelo se aproxima a la perfección.
Lea también: OpenAI propone semana laboral de cuatro días para frenar el impacto de la IA en el empleo
Presenta, además, una tasa de alucinaciones significativamente menor que otros sistemas. Es decir, que cuando no tiene información suficiente, Mythos responde “no lo sé” en lugar de inventar una respuesta.
Sin embargo, el mismo informe advierte sobre una nueva clase de riesgo. Cuando el modelo se equivoca en tareas complejas, sus respuestas erróneas están tan bien argumentadas y son tan sutiles que incluso expertos pueden tener dificultades para detectarlas. Eso obliga a realizar verificaciones profundas y representa un desafío inédito para quienes trabajan con el sistema.
Anthropic considera que Mythos Preview es el inicio de una nueva generación de modelos con capacidades defensivas avanzadas y no descarta que en los próximos meses surjan sistemas aún más sofisticados.