Os custos de inferência em ascensão estão levando as empresas de IA a reconsidrar a crença de longa data de que modelos maiores sempre vencem. Insiders da indústria, incluindo o co-fundador da Coinbase, Brian Armstrong, preveem que, dentro de um ano e meio, a maioria das cargas de trabalho migrará para modelos menos dispendiosos. Testes iniciais da startup de legal-tech Harvey mostram uma redução de três vezes nos gastos de computação sem sacrificar a qualidade, despertando um debate mais amplo sobre a economia da IA em larga escala e o futuro de laboratórios pesados, como a OpenAI e a Anthropic.
Ler mais