A Anthropic apresentou o Claude Sonnet 5 na terça-feira, chamando-o de "o modelo Sonnet mais agente até o momento". A etiqueta reflete uma nova ênfase no design: em vez de apenas responder a perguntas, o modelo pode traçar um curso de ação, invocar ferramentas externas, como navegadores da web e terminais de linha de comando, e realizar tarefas com muito menos orientação passo a passo.
De acordo com a empresa, o Sonnet 5 pode "criar planos, usar ferramentas como navegadores e terminais, e executar tarefas de forma autônoma em um nível que, apenas alguns meses atrás, exigia modelos maiores e mais caros". A atualização é direcionada a cargas de trabalho profissionais - particularmente codificação e tarefas de escritório diárias - onde os usuários exigem não apenas conselhos, mas execução concreta.
As métricas de desempenho comprovam a afirmação. No segmento de codificação agente da suite Terminal-bench 2.1, o Sonnet 5 alcançou uma taxa de sucesso de 80,5%, um salto considerável em relação aos 67% registrados por seu antecessor, o Sonnet 4.6. A Anthropic afirma que a melhoria reduz a lacuna entre modelos econômicos e as ofertas de alto nível que anteriormente dominavam cenários de uso de ferramentas complexas.
O acesso ao novo modelo é amplo. A Anthropic tornou o Sonnet 5 o motor padrão para todos os níveis de usuário, desde o plano gratuito até a assinatura Pro. Ele também é lançado para os clientes Max, Team e Enterprise, e está integrado ao Claude Code, bem como à plataforma Claude como um todo. A decisão de democratizar a tecnologia destaca a crença da empresa de que as capacidades agentes logo se tornarão uma expectativa básica, e não um recurso premium.
O lançamento ocorre em meio a uma mudança mais ampla na indústria. O Gemini Spark, da Google, anunciado como um assistente pessoal agente 24/7, estreou no início do mês, sinalizando que os principais players estão correndo para incorporar planejamento e uso de ferramentas em seus produtos de IA. Ao mesmo tempo, o próprio Claude Fable 5 e o Mythos 5, da Anthropic, atraíram escrutínio regulatório, enquanto o GPT-5.6, da OpenAI, permanece em revisão pelas autoridades dos EUA.
Os analistas interpretam a mudança como um movimento afastando-se da tradicional corrida armamentista de chatbots, que se concentrou na fluência conversacional, em direção a uma competição focada na execução. "A próxima etapa da guerra de IA não será vencida pelo chatbot que dá a resposta mais elegante", alertou um post no blog da Anthropic. "Ela será vencida pelo assistente que pode pegar uma tarefa confusa, manter o plano e realmente fazer algo útil".
Para os desenvolvedores, a mudança pode significar geração de código mais confiável sem a necessidade de engenharia de prompts extensiva. Os usuários de negócios podem logo confiar na IA para redigir relatórios, agendar reuniões ou até mesmo solucionar problemas de software - tarefas que anteriormente exigiam supervisão humana em cada etapa.
Embora o lançamento seja entusiasmado, a Anthropic reconhece que o comportamento autônomo levanta considerações de segurança. A empresa afirma que continua a aprimorar barreiras e ferramentas de monitoramento para prevenir o uso indevido, especialmente à medida que o modelo ganha alcance mais amplo em todos os níveis, gratuitos e pagos.
Em resumo, o Claude Sonnet 5 representa um salto tangível em direção a assistentes de IA que atuam mais como colaboradores do que como meras fontes de informação. Se o mercado adotará rapidamente esse novo paradigma, ainda está para ser visto, mas o sinal da Anthropic é claro: o futuro da IA gerativa está em fazer, não apenas em falar.
Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.