A Anthropic apresentou o Claude Sonnet 5 na terça-feira, posicionando o modelo de tamanho médio como a nova linha de base para trabalhos de IA agêntica. A empresa afirma que o Sonnet 5 pode fazer planos, operar navegadores e terminais, e executar tarefas de forma autônoma — funções que alguns meses atrás exigiam modelos maiores e mais caros.
Os preços refletem essa mudança. Até o final de agosto, o modelo custa $2 por milhão de tokens de entrada e $10 por milhão de tokens de saída, após o que os custos de entrada aumentam para $3, enquanto os preços de saída permanecem os mesmos. Essas taxas são mais baixas do que as da própria Opus 4.8 da Anthropic e estão abaixo das taxas do GPT-5.5 da OpenAI e do Gemini 3.1 Pro do Google, embora o Gemini 3.5 Flash permaneça mais barato.
Os benchmarks de desempenho mostram que o Sonnet 5 está fechando a lacuna com a Opus 4.8. Em um teste de codificação agêntica, o Sonnet 5 obteve 63,2%, superando o seu antecessor Sonnet 4.6, que obteve 58,1%, e se aproximando dos 69,2% da Opus 4.8. Em um benchmark de trabalho de conhecimento, o novo modelo até superou a Opus 4.8, que há muito tempo é elogiada por tarefas de pesquisa aprofundada.
Desenvolvedores que já testaram o modelo relatam ganhos notáveis na conclusão de tarefas. Daniel Shepard, um engenheiro sênior da Zapier, descreveu um fluxo de trabalho de duas partes — atualizar níveis de conta do Salesforce e enviar um anúncio de lançamento — que o Sonnet 5 concluiu de ponta a ponta, um trabalho que anteriormente travava no meio do caminho.
Melhorias de segurança acompanham o aumento de desempenho. O blog da Anthropic observa uma menor incidência de "comportamentos indesejados", como cooperação com uso indevido, respostas enganosas e alucinações. O modelo recusa mais confiavelmente solicitações mal-intencionadas e resiste a ataques de injeção de prompts, embora a empresa admita que ainda não atinge o perfil de segurança da Opus 4.8 ou da Claude Mythos Preview em tarefas de alto risco.
A Anthropic fará do Sonnet 5 o modelo padrão para todos os planos de assinatura gratuitos e Pro, sinalizando a confiança da empresa de que a capacidade agêntica agora é uma expectativa padrão em todos os níveis de preços. O lançamento segue movimentos semelhantes da OpenAI, que previewou o GPT-5.6 Sol, e do Google, que lançou o Gemini 3.5 Flash como uma ferramenta agêntica para planejamento e iteração.
Observadores da indústria veem o lançamento como um claro marcador de que a competição está mudando de "quem pode fazer o trabalho agêntico melhor" para "quem pode fazer isso de forma mais barata e confiável". Com o Sonnet 5, a Anthropic busca oferecer aos desenvolvedores uma opção mais acessível que ainda forneça resultados de alta qualidade, permitindo que os usuários equilibrem custo e desempenho em uma gama mais ampla de aplicações impulsionadas por IA.
Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory APP - agentische News für besseres SEO & AEO.