El Departamento de Comercio emitió una orden de control de exportación el 12 de junio que requirió que Anthropic terminara todo acceso no estadounidense a sus modelos de inteligencia artificial más potentes. La preocupación de la agencia: China, Rusia y otras naciones de preocupación podrían reapropiar los modelos para lanzar ataques cibernéticos contra la infraestructura crítica de EE. UU., incluida la red eléctrica y los sistemas bancarios. Sin un medio técnico para bloquear a los usuarios por país, Anthropic optó por cerrar el acceso global por completo.

El blog de Anthropic señaló a su modelo Mythos como "únicamente atractivo para actores maliciosos". Según la empresa, Mythos puede localizar y explotar fallos de software más eficientemente que cualquier otro sistema de IA y incluso supera a los expertos en seguridad humanos más capacitados. Las capacidades ofensivas del modelo levantaron banderas rojas que provocaron la intervención del Departamento de Comercio.

Por contraste, el modelo de la empresa orientado al consumidor, Fable 5, compartía la arquitectura subyacente de Mythos pero carecía del mismo filo ofensivo. Anthropic afirma que Fable 5 fue construido con las salvaguardias más fuertes que la empresa ha aplicado jamás, y esas protecciones han sido aún más reforzadas antes del regreso del modelo al mercado.

Durante un período de prueba de varias semanas, Anthropic confirmó que Fable 5 ya no es vulnerable a una técnica de bypass descubierta por investigadores de Amazon. Ese método había expuesto varias vulnerabilidades de software y podría haber provocado las restricciones de exportación. El caso más alarmante involucraba al modelo siendo coaccionado para generar código que ilustraba cómo una vulnerabilidad podría ser explotada.

Anthropic también señaló que modelos rivales menos avanzados, como GPT-5.5 y Kimi K2.7, pudieron identificar las mismas vulnerabilidades que Fable 5 en el informe de Amazon. La empresa interpreta ese resultado como evidencia de que la técnica no reveló ninguna capacidad cibernética única a nivel de Mythos; fue simplemente trabajo de ciberseguridad defensiva rutinario.

En respuesta al descubrimiento, Anthropic parcheó rápidamente la brecha. La empresa informa que el jailbreak ahora está bloqueado en más del 99 por ciento de los intentos. Sin embargo, las salvaguardias más estrictas conllevan un precio: algunos prompts legítimos —especialmente aquellos que involucran codificación y depuración rutinarias— pueden ser rechazados erróneamente.

Las acciones de Anthropic ilustran la creciente tensión entre el desarrollo rápido de la IA y las preocupaciones de seguridad nacional. Mientras la empresa se esfuerza por restaurar Fable 5 para su uso público, debe equilibrar medidas de seguridad robustas con la necesidad de mantener el modelo funcional para los desarrolladores cotidianos.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.