El Departamento de Comercio emitió una directiva de control de exportaciones el viernes por la tarde, obligando a Anthropic a cortar el acceso a sus dos modelos insignia, Claude Fable 5 y Claude Mythos 5, para todos los usuarios en todo el mundo. La orden llegó a las 5:21 p.m. ET y se presentó como una medida de seguridad nacional después de que los funcionarios advirtieron que los modelos podrían ser explotados para descubrir vulnerabilidades de software.

Anthropic respondió en su cuenta de X, confirmando el cierre y expresando frustración. En una publicación detallada en su blog, la empresa dijo que solo recibió evidencia verbal de un "posible intento de jailbreak estrecho y no universal" – esencialmente una solicitud que coaccionó al modelo para escanear una base de código en busca de fallos. Anthropic mantiene que esta capacidad ya existe en otros modelos públicamente disponibles, incluido el GPT-5.5 de OpenAI, y es utilizada rutinariamente por profesionales de la ciberseguridad.

Claude Mythos 5, el modelo más capaz de la empresa, debutó a principios de abril bajo una implementación estrictamente controlada. Anthropic describió a Mythos como único en su capacidad para identificar agujeros de seguridad en los principales sistemas operativos y navegadores. Para prevenir el mal uso, limitó a Mythos a un grupo selecto de aproximadamente 50 organizaciones verificadas a través de Project Glasswing, un programa que incluye a Amazon, Apple, Google, Microsoft y CrowdStrike. Estos socios utilizan el modelo para trabajar en ciberseguridad defensiva.

Claude Fable 5, lanzado solo tres días antes de la orden del gobierno, es una versión comercial de Mythos con guardias adicionales que bloquean temas de alto riesgo, como técnicas de ciberseguridad avanzadas e investigación biológica. Las pruebas de benchmark de Vals AI, una firma que rastrea el rendimiento de la IA, enumeraron a Fable 5 como el modelo más capaz accesible públicamente en el momento de su lanzamiento.

La acción de control de exportaciones técnicamente apunta al acceso de nacionales extranjeros, pero el cumplimiento de Anthropic se extiende a todos los usuarios, efectivamente retirando los modelos del mercado global. La empresa argumenta que la medida es desproporcionada. "No estamos de acuerdo en que el hallazgo de un posible intento de jailbreak estrecho debería ser causa para retirar un modelo comercial desplegado a cientos de millones de personas", se leyó en el blog. Anthropic advierte que aplicar el mismo estándar en toda la industria detendría la implementación de modelos de vanguardia de todos los proveedores.

La seguridad ha sido un pilar de la imagen pública de Anthropic mientras se prepara para una posible IPO más tarde este año. La postura cautelosa de la empresa sobre Mythos, etiquetándolo como un "modelo tan peligroso que no podía ser lanzado públicamente", ahora parece haber tenido un efecto contrario, atrayendo una mayor escrutinio de los reguladores. Sam Altman de OpenAI previamente calificó la comercialización de Anthropic alrededor de Mythos como "basada en el miedo", señalando la estrategia de la empresa de vender un "refugio antibombas" para su tecnología.

Los salvaguardas internos de Anthropic dependen de sistemas de clasificación independientes que operan por separado del modelo de lenguaje en sí. Según la empresa, incluso si un usuario logra coaccionar al modelo para que ignore una negativa, estos clasificadores continúan bloqueando salidas peligrosas. La directiva del gobierno sugiere que los funcionarios no están convencidos de que esas capas sean suficientes.

Mientras que el cierre solo afecta a los dos modelos más nuevos, las implicaciones más amplias podrían extenderse por la industria de la IA. Las empresas pueden reconsiderar cómo equilibran los lanzamientos rápidos de modelos con el cumplimiento normativo, especialmente a medida que las autoridades de EE. UU. endurecen las políticas de control de exportaciones sobre la IA avanzada. Los próximos pasos de Anthropic siguen sin estar claros, pero el liderazgo de la empresa ha señalado que continuará presionando para una evaluación más matizada del presunto intento de jailbreak.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.