A Anthropic disse na sexta-feira que suspendeu o acesso a seus dois últimos modelos de IA, Claude Fable 5 e Mythos 5, após receber uma diretiva de controle de exportação do governo dos EUA. A carta, entregue às 17h21, horário de Nova York, alertou que os modelos poderiam ser explorados por meio de uma técnica de "jailbreak" recém-descoberta que poderia comprometer a segurança nacional. Em resposta, a empresa cortou o acesso aos modelos para todos os clientes, incluindo funcionários estrangeiros, e publicou uma explicação detalhada em seu blog.

A diretiva chegou em meio a um conflito mais amplo entre a Anthropic e a administração Trump. No início deste ano, o Departamento de Defesa rotundou a empresa como um "risco na cadeia de suprimentos" após a Anthropic se opor ao uso de sua tecnologia pelo militar. Essa designação proibiu as agências federais e os contratantes de empregar a IA da Anthropic, levando a empresa a entrar com processos judiciais para contestar a decisão.

Claude Fable 5, uma variante do modelo Mythos da Anthropic, foi lançado publicamente com salvaguardas embutidas que bloqueiam consultas sobre cibersegurança, biologia e química. A Anthropic alegou que o lançamento foi coordenado com o governo dos EUA e seguiu uma pré-visualização limitada do Mythos em abril, projetada para permitir que as organizações testassem recursos poderosos de cibersegurança enquanto limitavam o abuso. A empresa disse que as salvaguardas foram projetadas para ajudar as empresas a reforçar suas defesas sem dar atalhos aos atacantes.

No seu post no blog, a Anthropic explicou que a preocupação do governo centrou-se em um método que poderia contornar essas salvaguardas. A empresa revisou uma demonstração onde a técnica identificou um punhado de vulnerabilidades de software conhecidas e relativamente simples. A Anthropic observou que outros modelos publicamente disponíveis podem descobrir as mesmas falhas sem qualquer "jailbreak", sugerindo que o risco não era exclusivo de sua tecnologia.

"Nossa compreensão é que o governo acredita que se tornou ciente de um método de contornar, ou 'jailbreak' o Fable 5", disse o blog. "Revisamos uma demonstração dessa técnica específica sendo usada para identificar um pequeno número de vulnerabilidades conhecidas e menores. Essas vulnerabilidades todas parecem relativamente simples, e descobrimos que outros modelos publicamente disponíveis podem descobri-los sem precisar de um contorno".

A empresa argumentou que o "jailbreak" identificado era limitado e não tornaria um atacante significativamente mais perigoso do que usar qualquer outro modelo de IA. De acordo com a Anthropic, a única evidência que o governo forneceu foi verbal, descrevendo uma situação em que um usuário pede ao modelo para ler uma base de código específica e corrigir falhas de software. A empresa disse que um possível "jailbreak" havia sido compartilhado com os funcionários.

Porta-vozes da Casa Branca e do Departamento de Comércio dos EUA não responderam imediatamente a pedidos de comentários. O CEO da Anthropic, Dario Amodei, reiterou em um ensaio de política mais cedo esta semana que a empresa apoia um processo governamental transparente e estruturado para bloquear lançamentos de IA inseguros. Ele criticou a ação atual como aquém desses princípios, acrescentando que a empresa já havia tomado medidas para mitigar o mau uso.

A decisão da Anthropic de retirar os modelos destaca a tensão crescente entre a inovação rápida em IA e a fiscalização regulatória. À medida que os legisladores e as agências lidam com como equilibrar a segurança nacional com o avanço tecnológico, empresas como a Anthropic se encontram navegando em um cenário de conformidade cada vez mais complexo.

Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.