O Departamento de Comércio emitiu uma ordem de controle de exportação em 12 de junho, exigindo que a Anthropic terminasse todo o acesso não americano aos seus modelos de inteligência artificial mais poderosos. A preocupação da agência: a China, a Rússia e outras nações de preocupação poderiam reutilizar os modelos para lançar ataques cibernéticos contra a infraestrutura crítica dos EUA, incluindo a rede elétrica e os sistemas bancários. Sem um meio técnico para bloquear usuários por país, a Anthropic optou por fechar o acesso global inteiramente.
O blog da Anthropic destacou seu modelo Mythos como "unicamente atraente para atores mal-intencionados". De acordo com a empresa, o Mythos pode localizar e explorar falhas de software mais eficientemente do que qualquer outro sistema de IA e até supera os especialistas de segurança humanos mais qualificados. As capacidades ofensivas do modelo levantaram bandeiras vermelhas que provocaram a intervenção do Departamento de Comércio.
Em contraste, o modelo de consumo da empresa, Fable 5, compartilha a arquitetura subjacente do Mythos, mas carece da mesma vantagem ofensiva. A Anthropic afirma que o Fable 5 foi construído com as salvaguardas mais fortes que a empresa já aplicou, e essas proteções foram ainda mais reforçadas antes do retorno do modelo ao mercado.
Durante um período de teste de várias semanas, a Anthropic confirmou que o Fable 5 não é mais vulnerável a uma técnica de bypass descoberta por pesquisadores da Amazon. Esse método havia exposto várias vulnerabilidades de software e poderia ter provocado as restrições de exportação. O exemplo mais alarmante envolvia o modelo sendo coagido a gerar código que ilustrava como uma vulnerabilidade poderia ser explorada.
A Anthropic também observou que modelos rivais menos avançados, como o GPT-5.5 e o Kimi K2.7, foram capazes de identificar as mesmas vulnerabilidades que o Fable 5 identificou no relatório da Amazon. A empresa interpreta esse resultado como evidência de que a técnica não revelou nenhuma capacidade cibernética única de nível Mythos; foi apenas trabalho de cibersegurança defensiva rotineiro.
Em resposta à descoberta, a Anthropic rapidamente corrigiu a brecha. A empresa relata que a jailbreak agora é bloqueada em mais de 99 por cento das tentativas. No entanto, as salvaguardas mais rígidas vêm com um trade-off: alguns prompts legítimos — especialmente aqueles envolvendo codificação e depuração rotineiras — podem ser rejeitados por engano.
As ações da Anthropic ilustram a crescente tensão entre o desenvolvimento rápido de IA e as preocupações de segurança nacional. Enquanto a empresa se esforça para restaurar o Fable 5 para uso público, ela deve equilibrar medidas de segurança robustas com a necessidade de manter o modelo funcional para desenvolvedores comuns.
This article was written with the assistance of AI.
News Factory APP - agentic news to boost your SEO & AEO.