Após um diálogo prolongado com a administração Trump, a Anthropic confirmou na quarta-feira que o Departamento de Comércio suspendeu os controles de exportação de seu modelo Claude Fable 5. A decisão abre caminho para a empresa restaurar o acesso global ao sistema de IA, que havia sido afastado no início de junho após autoridades levantarem preocupações sobre possíveis jailbreaks.
Em uma postagem no X, a Anthropic disse que começará a restaurar o acesso no dia seguinte e logo compartilhará uma atualização sobre o progresso. A empresa também indicou que planeja reativar o Fable 5 nas plataformas de nuvem Amazon Web Services, Google Cloud e Microsoft Foundry, embora não tenha estabelecido um prazo firme para a implantação em nuvem.
O post do blog da Anthropic, publicado na terça-feira à noite, detalhou as etapas que a empresa tomou para abordar o jailbreak que provocou a diretiva de controle de exportação. Uma equipe de pesquisas da Amazon havia sinalizado uma técnica que poderia contornar as salvaguardas do modelo. Em resposta, a Anthropic treinou um classificador de segurança aprimorado que bloqueia a exploração em mais de 99 por cento dos casos. Quando um pedido é bloqueado, os usuários são redirecionados para o modelo Opus 4.8 mais antigo e recebem uma notificação sobre a ação.
Novas medidas de segurança e parceria com o governo
A empresa enfatizou que o classificador atualizado representa uma melhoria significativa em sua ferramenta defensiva. Ela também anunciou uma série de iniciativas destinadas a uma colaboração mais estreita com o governo dos EUA. A Anthropic fornecerá acesso pré-lançamento a seus modelos para avaliações relacionadas à segurança nacional, permitindo que os parceiros do governo realizem testes independentes antes de uma implantação mais ampla. Durante esses períodos de teste, a agência terá acesso direto à equipe técnica da Anthropic.
Além dos testes, a Anthropic se comprometeu a compartilhar informações rapidamente sempre que surgir um padrão de jailbreak ou uso indevido significativo. A empresa está se unindo a outros laboratórios de IA líderes para criar um padrão de segurança e avaliação voluntário em toda a indústria. Para apoiar esses esforços, a Anthropic alocará recursos de computação dedicados, erguerá equipes especializadas para prioridades do governo e tornará sua expertise em segurança e equipe vermelha disponível para pesquisas conjuntas.
A Anthropic também anunciou uma equipe de monitoramento 24/7 que acompanhará os principais canais de envio de jailbreak. Um programa HackerOne futuro permitirá que pesquisadores externos enviem possíveis jailbreaks para o Fable 5, expandindo a supervisão de segurança do modelo.
Embora a suspensão do controle de exportação restaure o acesso para a maioria dos usuários, a administração Trump manteve o Mythos 5, o modelo mais avançado da Anthropic, limitado a uma lista pré-aprovada de organizações. Membros não americanos dessas organizações e funcionários estrangeiros da Anthropic agora podem recuperar o acesso, mas a implantação mais ampla permanece restrita.
A liderança da Anthropic encarou o desenvolvimento como um passo em direção à normalização da implantação de IA em meio a uma intensificação da fiscalização regulatória. A empresa, que está se preparando para uma oferta pública inicial, disse que continuará a coordenar com o governo para expandir o acesso a parceiros domésticos e internacionais.
Observadores da indústria notam que o timing coincide com o lançamento da OpenAI do GPT-5.6, que também entrou no mercado sob uma implantação em etapas governada por regras de controle de exportação semelhantes. Ambos os casos destacam a tensão crescente entre a inovação rápida em IA e as preocupações de segurança nacional.
A Anthropic concluiu seu post no blog com uma declaração: nenhum modelo de IA pode ser tornado completamente invulnerável a jailbreaks. A empresa espera a descoberta contínua de explorações menores e mais sérias e manterá seus pesquisadores de segurança engajados em atividades de equipe vermelha.
This article was written with the assistance of AI.
News Factory APP - agentic news to boost your SEO & AEO.