Anthropic anunció el viernes que ha bloqueado el acceso de todos los clientes a sus modelos de inteligencia artificial Fable 5 y Mythos 5. La decisión sigue una orden del gobierno recibida el 12 de junio que requirió que la empresa suspendiera el acceso para todos los nacionales extranjeros, sin importar la ubicación o el estatus laboral, por razones de riesgo de seguridad nacional.

Según el comunicado de la empresa, la directiva no afecta sus otras ofertas, incluido el chatbot Claude y modelos anteriores. Anthropic enmarcó la acción como una medida de cumplimiento, señalando que la orden específicamente apunta a los dos modelos más nuevos lanzados apenas unos días antes.

Por qué el gobierno intervino

Los funcionarios no han divulgado las preocupaciones de seguridad precisas detrás de la orden. Anthropic, sin embargo, cree que el impulso fue un método informado para jailbreak Fable 5. La empresa dijo que recibió evidencia verbal de un jailbreak limitado y no universal que una entidad no identificada compartió con las autoridades. Aunque los detalles siguen clasificados, Anthropic indicó que la posible explotación podría permitir a los usuarios evadir las salvaguardias diseñadas para prevenir el mal uso en contextos de ciberseguridad.

Fable 5, introducido el 9 de junio, se comercializó como una versión de cara al público del modelo de alta gama Mythos de Anthropic. Mythos, descrito como un sistema de ciberseguridad de última generación, actualmente está limitado a los socios del Proyecto Glasswing de Anthropic. En pruebas internas, Fable 5 demostró capacidades que superaron las versiones anteriores, incluso superando el videojuego Pokémon FireRed, un benchmark que Claude no pudo alcanzar.

Anthropic destacó las medidas de protección extensas incorporadas en Fable 5. La empresa dijo que implementó "salvaguardias sólidas" para reducir la probabilidad de que el modelo se utilice para tareas de ciberseguridad maliciosas. Algunos usuarios han reclamado que estas salvaguardias son demasiado amplias, pero Anthropic las defendió como necesarias para limitar el abuso.

La empresa también reconoció que ningún modelo de inteligencia artificial puede ser completamente inmune a los intentos de jailbreak. Su estrategia, explicó, es hacer que cualquier explotación exitosa seaeither estrechamente dirigida o prohibitivamente costosa de desarrollar. La monitorización continua está destinada a detectar y cerrar los ataques rápidamente.

Respuesta de Anthropic y próximos pasos

Mientras cumple con la orden del gobierno, Anthropic expresó su desacuerdo con la notion de que un solo método de jailbreak potencial justifica retirar un modelo comercial. La empresa se comprometió a compartir más detalles dentro de las próximas 24 horas, afirmando que cualquier acción para bloquear despliegues inseguros debe seguir un proceso estatutario transparente, justo y basado en hechos técnicos.

"Hemos abogado consistentemente por una supervisión clara y basada en hechos técnicos", se leyó en el comunicado. "Esta acción no se ajusta a esos principios".

Por ahora, la suspensión sigue en vigor, y los clientes que esperan acceder a Fable 5 y Mythos 5 deben esperar más aclaraciones de Anthropic y los reguladores del gobierno.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.