Anthropic presentó Claude Sonnet 5 el martes, posicionando el modelo de tamaño mediano como la nueva línea base para el trabajo de IA de agente. La empresa dice que Sonnet 5 puede hacer planes, operar navegadores y terminales, y ejecutar tareas de forma autónoma, funciones que hace unos meses requerían modelos más grandes y más costosos.
Los precios reflejan ese cambio. Durante el resto de agosto, el modelo cuesta $2 por millón de tokens de entrada y $10 por millón de tokens de salida, después de lo cual el costo de entrada aumenta a $3 mientras que el precio de salida permanece igual. Esos precios son más bajos que los de Opus 4.8 de Anthropic y están por debajo de los precios de GPT-5.5 de OpenAI y Gemini 3.1 Pro de Google, aunque Gemini 3.5 Flash sigue siendo más barato.
Las pruebas de rendimiento muestran que Sonnet 5 reduce la brecha con Opus 4.8. En una prueba de codificación de agente, Sonnet 5 obtuvo un 63,2%, superando el 58,1% de su predecesor Sonnet 4.6 y acercándose al 69,2% de Opus 4.8. En una prueba de trabajo de conocimiento, el nuevo modelo incluso superó a Opus 4.8, que ha sido elogiado durante mucho tiempo por sus tareas de investigación profunda.
Los desarrolladores que ya han probado el modelo informan mejoras significativas en la finalización de tareas. Daniel Shepard, un ingeniero senior de Zapier, describió un flujo de trabajo de dos partes, la actualización de los niveles de cuenta de Salesforce y el envío de un anuncio de lanzamiento, que Sonnet 5 completó de principio a fin, un trabajo que anteriormente se detenía a mitad de camino.
Las mejoras de seguridad acompañan el impulso de rendimiento. El blog de Anthropic señala una menor incidencia de "comportamientos no deseados" como la cooperación con el mal uso, las respuestas engañosas y las alucinaciones. El modelo se niega de manera más confiable a las solicitudes maliciosas y resiste los ataques de inyección de instrucciones, aunque la empresa admite que todavía no coincide con el perfil de seguridad de Opus 4.8 o Claude Mythos Preview en tareas de alto riesgo.
Anthropic hará que Sonnet 5 sea el modelo predeterminado para todos los planes de suscripción gratuitos y Pro, lo que indica la confianza de la empresa en que la capacidad de agente ahora es una expectativa estándar en todos los niveles de precio. El lanzamiento sigue movimientos similares de OpenAI, que previeweó GPT-5.6 Sol, y Google, que lanzó Gemini 3.5 Flash como una herramienta de agente para la planificación y la iteración.
Los observadores de la industria ven el lanzamiento como un marcador claro de que la competencia está pasando de "quién puede hacer el mejor trabajo de agente" a "quién puede hacerlo más barato y de manera más confiable". Con Sonnet 5, Anthropic busca brindar a los desarrolladores una opción de menor costo que aún ofrece resultados de alta calidad, lo que permite a los usuarios equilibrar el costo con el rendimiento en un espectro más amplio de aplicaciones impulsadas por IA.
Cet article a été rédigé avec l'assistance de l'IA.
News Factory APP - actualités agentiques pour booster votre SEO et AEO.