Anthropic dijo el viernes que suspendería el acceso a sus dos últimos modelos de inteligencia artificial, Claude Fable 5 y Mythos 5, después de recibir una directiva de control de exportación del gobierno de EE. UU. La carta, entregada a las 5:21 p.m. ET, advirtió que los modelos podrían ser explotados a través de una técnica de "liberación" recién descubierta que podría comprometer la seguridad nacional. En respuesta, la empresa cortó el acceso a los modelos para todos los clientes, incluidos los empleados de nacionalidad extranjera, y publicó una explicación detallada en su blog.

La directiva llegó en medio de un conflicto más amplio entre Anthropic y la administración Trump. Earlier este año, el Departamento de Defensa etiquetó a la empresa como un "riesgo de cadena de suministro" después de que Anthropic se opusiera al uso de su tecnología por parte de los militares. Esa designación prohibió a las agencias y contratistas federales emplear la inteligencia artificial de Anthropic, lo que llevó a la empresa a presentar demandas para impugnar la decisión.

Claude Fable 5, una variante del modelo Mythos de Anthropic, se lanzó públicamente con salvaguardias integradas que bloquean consultas sobre ciberseguridad, biología y química. Anthropic afirmó que el lanzamiento se coordinó con el gobierno de EE. UU. y siguió a una preview limitada de Mythos en abril, diseñada para permitir que las organizaciones probaran características de ciberseguridad poderosas mientras limitaban el abuso. La empresa dijo que las salvaguardias estaban destinadas a ayudar a las empresas a fortalecer sus defensas sin dar a los atacantes un pasaje rápido.

En su publicación de blog, Anthropic explicó que la preocupación del gobierno se centraba en un método que podría sortear esas salvaguardias. La empresa revisó una demostración donde la técnica identificó un puñado de vulnerabilidades de software conocidas y relativamente simples. Anthropic señaló que otros modelos públicamente disponibles pueden descubrir los mismos fallos sin necesidad de una liberación, sugiriendo que el riesgo no era único de su tecnología.

"Nuestra comprensión es que el gobierno cree que se ha enterado de un método para sortear, o \'liberar\' Fable 5", se lee en el blog. "Revisamos una demostración de esta técnica específica que se utilizó para identificar un pequeño número de vulnerabilidades conocidas y menores. Estas vulnerabilidades todas parecen relativamente simples, y hemos encontrado que otros modelos públicamente disponibles pueden descubrirlos también sin necesidad de una liberación".

La empresa argumentó que la liberación identificada era limitada y no haría que un atacante fuera significativamente más peligroso que al usar cualquier otro modelo de inteligencia artificial. Según Anthropic, la única evidencia que el gobierno proporcionó fue verbal, describiendo un escenario en el que un usuario le pide al modelo que lea una base de código específica y corrija fallos de software. La empresa dijo que una posible liberación de este tipo había sido compartida con los funcionarios.

Los portavoces de la Casa Blanca y el Departamento de Comercio de EE. UU. no respondieron de inmediato a las solicitudes de comentarios. El CEO de Anthropic, Dario Amodei, reiteró en un ensayo de política earlier esta semana que la empresa apoya un proceso de gobierno transparente y estructurado para bloquear lanzamientos de inteligencia artificial inseguros. Criticó la acción actual por no cumplir con esos principios, agregando que la empresa ya había tomado medidas para mitigar el mal uso.

La decisión de Anthropic de retirar los modelos subraya la creciente tensión entre la innovación rápida de la inteligencia artificial y la supervisión regulatoria. A medida que los legisladores y las agencias luchan por equilibrar la seguridad nacional con el avance tecnológico, las empresas como Anthropic se encuentran navegando por un panorama de cumplimiento cada vez más complejo.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.