Andrej Karpathy, um nome sinônimo dos primeiros dias da inteligência artificial moderna, confirmou na segunda-feira que se juntou à equipe de pré-treinamento da Anthropic. O ex-cofundador da OpenAI irá liderar um novo grupo encarregado de usar o modelo Claude da Anthropic para acelerar a etapa de pré-treinamento que subjaz os grandes modelos de linguagem.
A postagem de Karpathy no X sobre a mudança foi vista por mais de 13 milhões de pessoas. Nele, ele escreveu que os próximos anos na fronteira do desenvolvimento de grandes modelos de linguagem serão especialmente formativos e que ele permanece profundamente apaixonado pela educação - uma causa que ele planeja reatar assim que seu novo papel se estabelecer.
Sua carreira lê como uma linha do tempo de marcos da IA. Após obter um Ph.D. em Stanford sob a orientação de Fei-Fei Li, Karpathy co-fundou a OpenAI em 2015 e ajudou a moldar sua pesquisa de aprendizado profundo nos primeiros dias. Ele deixou a organização em 2017 para se tornar o diretor de IA da Tesla, onde liderou as equipes de visão computacional por trás do programa de Direção Autônoma e Autopilot. Ele deixou a Tesla em julho de 2022, retornou brevemente à OpenAI e, em 2024, lançou a Eureka Labs, uma startup que aplicou assistentes de IA à educação. Essa empreitada agora está em pausa enquanto Karpathy se dedica à Anthropic.
A Anthropic, liderada pelo CEO Dario Amodei, tem feito uma série de aquisições de talentos enquanto seu principal rival, a OpenAI, lida com uma série de saídas de executivos seniores. As saídas recentes da OpenAI incluem a CTO Mira Murati, o pioneer em aprendizado por reforço John Schulman e três executivos que deixaram a empresa em um único dia em abril de 2026. A chegada de Karpathy sinaliza que a Anthropic pode atrair pesquisadores de alto nível mesmo em meio a essa turbulência.
A valoração da empresa é relatada em aproximadamente $800 bilhões, e insiders dizem que uma oferta pública inicial pode se materializar já no final de 2026. Ao construir uma equipe que aproveita o Claude para acelerar seu próprio pipeline de pré-treinamento, a Anthropic espera demonstrar uma forma prática de auto-aperfeiçoamento recursivo - um conceito que há muito tempo intriga a comunidade de segurança da IA.
Se bem-sucedida, o Claude poderia reduzir significativamente o tempo e o custo necessários para treinar a próxima geração de modelos. Isso redefiniria a economia da indústria de IA, onde o pré-treinamento sozinho representa a maior parte do gasto computacional. A cultura de segurança em primeiro lugar da Anthropic, cultivada desde sua fundação, também pode ajudar a acalmar as preocupações sobre acelerar as capacidades da IA sem supervisão adequada.
Para Karpathy, a mudança parece um retorno ao laboratório. "Estou animado em estar de volta a construir modelos na fronteira", ele escreveu. A combinação de sua expertise em aprendizado profundo, experiência em escalonar sistemas de visão para veículos autônomos e trabalho recente em educação impulsionada por IA o posiciona para impulsionar os limites do que o Claude pode alcançar.
Analistas da indústria veem a contratação como um indicador para a guerra mais ampla de talentos entre as potências da IA. À medida que a Anthropic continua a atrair pesquisadores de alto perfil, pode forçar os rivais a redobrar as estratégias de retenção e explorar novas abordagens para a eficiência dos modelos.
Se a estratégia de pré-treinamento centrada no Claude da Anthropic irá cumprir sua promessa, ainda está para ser visto, mas a participação de Karpathy adiciona uma camada de credibilidade ao ambicioso roadmap da empresa. Por enquanto, a comunidade de IA observa atentamente enquanto uma das figuras mais reconhecidas do campo assume um papel que pode redefinir como os grandes modelos de linguagem são construídos.
Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.