Después de un diálogo prolongado con la administración de Trump, Anthropic confirmó el miércoles que el Departamento de Comercio ha levantado los controles de exportación sobre su modelo Claude Fable 5. La decisión abre el camino para que la empresa restaure el acceso global al sistema de inteligencia artificial, que había sido desactivado a principios de junio después de que los funcionarios expresaran preocupaciones sobre posibles jailbreaks.

En una publicación en X, Anthropic dijo que comenzará a restaurar el acceso al día siguiente y pronto compartirá una actualización sobre el progreso. La empresa también indicó que planea reactivar Fable 5 en Amazon Web Services, Google Cloud y Microsoft Foundry, aunque no estableció un cronograma firme para la implementación en la nube.

La publicación del blog de Anthropic, publicada el martes por la noche, detalló los pasos que la empresa tomó para abordar el jailbreak que provocó la directiva de control de exportación. Un equipo de investigación de Amazon había señalado una técnica que podría sortear las salvaguardias del modelo. En respuesta, Anthropic entrenó un clasificador de seguridad mejorado que bloquea el exploit en más del 99 por ciento de los casos. Cuando se bloquea una solicitud, los usuarios son redirigidos al modelo Opus 4.8 y reciben una notificación sobre la acción.

Nuevas medidas de seguridad y colaboración con el gobierno

La empresa enfatizó que el clasificador actualizado representa una mejora significativa de su kit de defensa. También anunció una serie de iniciativas destinadas a una colaboración más estrecha con el gobierno de EE. UU. Anthropic proporcionará acceso previo a sus modelos para evaluaciones relacionadas con la seguridad nacional, lo que permitirá a los socios del gobierno realizar pruebas independientes antes de una implementación más amplia. Durante estos periodos de prueba, la agencia tendrá acceso directo al personal técnico de Anthropic.

Más allá de las pruebas, Anthropic se comprometió a compartir información de manera rápida siempre que surja un patrón de jailbreak o mal uso importante. La empresa se une a otras empresas de inteligencia artificial líderes para crear un estándar de seguridad y evaluación voluntario a nivel de la industria. Para apoyar estos esfuerzos, Anthropic asignará recursos de cómputo dedicados, creará equipos especializados para prioridades del gobierno y hará que su experiencia en seguridad y equipos rojos esté disponible para investigaciones conjuntas.

Anthropic también anunció un equipo de monitoreo de 24/7 que rastreará los canales de presentación de jailbreak clave. Un programa de HackerOne próximo permitirá a investigadores externos presentar posibles jailbreaks para Fable 5, ampliando la supervisión de seguridad del modelo.

Si bien la eliminación del control de exportación restaura el acceso para la mayoría de los usuarios, la administración de Trump ha mantenido el modelo Mythos 5, más avanzado de Anthropic, limitado a una lista preaprobada de organizaciones. Los miembros no estadounidenses de esas organizaciones y los empleados extranjeros de Anthropic pueden volver a tener acceso, pero la implementación más amplia sigue siendo limitada.

El liderazgo de Anthropic enmarcó el desarrollo como un paso hacia la normalización de la implementación de la inteligencia artificial en medio de un escrutinio regulatorio aumentado. La empresa, que se prepara para una oferta pública inicial, dijo que seguirá coordinando con el gobierno para ampliar el acceso a socios tanto nacionales como internacionales.

Los observadores de la industria señalan que la coincidencia se produce con el lanzamiento de GPT-5.6 de OpenAI, que también entró en el mercado bajo una implementación escalonada gobernada por reglas de control de exportación similares. Ambos casos resaltan la creciente tensión entre la innovación rápida de la inteligencia artificial y las preocupaciones de seguridad nacional.

Anthropic concluyó su publicación del blog con una advertencia: ningún modelo de inteligencia artificial puede hacerse completamente invulnerable a los jailbreaks. La empresa espera el descubrimiento continuo de exploits menores y más serios, y mantendrá a sus investigadores de seguridad comprometidos en actividades de equipo rojo.

Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.