A Anthropic anunciou na sexta-feira que bloqueou o acesso de todos os clientes aos seus modelos de inteligência artificial Fable 5 e Mythos 5. A decisão segue uma ordem do governo recebida em 12 de junho que exigia que a empresa suspendesse o acesso para todos os nacionais estrangeiros, independentemente de localização ou status de emprego, com base em riscos de segurança nacional.
De acordo com o comunicado da empresa, a diretiva não afeta suas outras ofertas, incluindo o chatbot Claude e modelos anteriores. A Anthropic enquadrou a ação como uma medida de conformidade, observando que a ordem visa especificamente os dois modelos mais novos lançados apenas alguns dias antes.
Por que o governo interveniu
Os funcionários não divulgaram as preocupações de segurança específicas por trás da ordem. A Anthropic, no entanto, acredita que o impulso foi um método relatado para jailbreak do Fable 5. A empresa disse que recebeu evidências verbais de um jailbreak estreito e não universal que uma entidade não identificada compartilhou com as autoridades. Embora os detalhes permaneçam classificados, a Anthropic indicou que a possível exploração poderia permitir que os usuários contornassem salvaguardas projetadas para prevenir o mau uso em contextos de cibersegurança.
O Fable 5, lançado em 9 de junho, foi comercializado como uma versão de enfrentamento público do modelo de ponta da Anthropic, o Mythos. O Mythos, descrito como um sistema de cibersegurança de última geração, está atualmente limitado aos parceiros do Projeto Glasswing da Anthropic. Em testes internos, o Fable 5 demonstrou capacidades que superaram as versões anteriores, mesmo superando o jogo de vídeo Pokémon FireRed - uma referência que o Claude não podia alcançar.
A Anthropic destacou as medidas de proteção extensas incorporadas ao Fable 5. A empresa disse que implementou "salvaguardas fortes" para reduzir a probabilidade de o modelo ser usado para tarefas de cibersegurança maliciosas. Alguns usuários reclamaram que essas salvaguardas são excessivamente amplas, mas a Anthropic as defendeu como necessárias para limitar o abuso.
A empresa também reconheceu que nenhum modelo de IA pode ser completamente imune a tentativas de jailbreak. Sua estratégia, explicou, é tornar qualquer exploração bem-sucedida seja estreitamente direcionada ou proibitivamente cara para desenvolver. O monitoramento contínuo é projetado para detectar e encerrar ataques rapidamente.
Resposta da Anthropic e próximos passos
Enquanto cumpre a ordem do governo, a Anthropic expressou desacordo com a noção de que uma única exploração potencial de jailbreak justifica a recall de um modelo comercial. A empresa prometeu compartilhar mais detalhes dentro das próximas 24 horas, afirmando que qualquer ação para bloquear implantações inseguras deve seguir um processo estatutário transparente, justo e baseado em fatos técnicos.
"Tempos consistentemente chamado por supervisão que é clara e baseada em fatos técnicos", leu o comunicado. "Essa ação não adere a esses princípios".
Por enquanto, a suspensão permanece em vigor, e os clientes que aguardam acesso ao Fable 5 e ao Mythos 5 devem aguardar mais esclarecimentos tanto da Anthropic quanto dos reguladores do governo.
Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.