Andrej Karpathy, un nombre sinónimo de los primeros días de la inteligencia artificial moderna, confirmó el lunes que se ha unido al equipo de preentrenamiento de Anthropic. El ex cofundador de OpenAI encabezará un grupo completamente nuevo encargado de utilizar el modelo Claude de Anthropic para acelerar la etapa de preentrenamiento intensiva en computación que subyace a los grandes modelos de lenguaje.
La publicación de Karpathy en X sobre el movimiento drew más de 13 millones de visitas. En ella, escribió que los próximos años en la frontera del desarrollo de grandes modelos de lenguaje (LLM) serán especialmente formativos, y que sigue siendo profundamente apasionado de la educación, una causa que planea revisitar una vez que su nuevo rol se estabilice.
Su carrera se lee como una línea de tiempo de los hitos de la inteligencia artificial. Después de obtener un doctorado en Stanford bajo la supervisión de Fei-Fei Li, Karpathy cofundó OpenAI en 2015 y ayudó a dar forma a su investigación temprana en aprendizaje profundo. Dejó la organización en 2017 para convertirse en el director de inteligencia artificial de Tesla, donde lideró los equipos de visión por computadora detrás de la conducción autónoma y el piloto de automático. Dejó Tesla en julio de 2022, regresó brevemente a OpenAI y en 2024 lanzó Eureka Labs, una startup que aplicaba asistentes de inteligencia artificial a la educación. Esa empresa ahora está en pausa mientras Karpathy se suma a Anthropic.
Anthropic, liderada por el CEO Dario Amodei, ha estado en una carrera de adquisición de talentos mientras su rival principal, OpenAI, se ha visto afectada por una serie de salidas de personal senior. Las salidas recientes de OpenAI incluyen a la CTO Mira Murati, al pionero del aprendizaje de refuerzo John Schulman y a tres ejecutivos que dejaron la empresa en un solo día en abril de 2026. La llegada de Karpathy señala que Anthropic puede atraer a investigadores de primer nivel incluso en medio de esta turbulencia.
La valoración de la empresa se informa en aproximadamente $800 mil millones, y los insiders dicen que una oferta pública inicial podría materializarse a finales de 2026. Al construir un equipo que aproveche Claude para acelerar su propia canalización de preentrenamiento, Anthropic espera demostrar una forma práctica de auto-mejora recursiva, un concepto que ha intrigado durante mucho tiempo a la comunidad de seguridad de la inteligencia artificial.
Si tiene éxito, Claude podría reducir significativamente el tiempo y el costo necesarios para entrenar a la próxima generación de modelos. Eso reformaría la economía de la industria de la inteligencia artificial, donde el preentrenamiento solo representa la mayor parte del gasto en computación. La cultura de seguridad en primer lugar de Anthropic, cultivada desde su fundación, también puede ayudar a mitigar las preocupaciones sobre la aceleración de las capacidades de la inteligencia artificial sin una supervisión adecuada.
Para Karpathy, el movimiento se siente como un regreso al laboratorio. "Estoy emocionado de estar de vuelta construyendo modelos en la frontera", escribió. La combinación de su experiencia en aprendizaje profundo, su experiencia en la escalabilidad de sistemas de visión para vehículos autónomos y su trabajo reciente en educación impulsada por la inteligencia artificial lo posiciona para empujar los límites de lo que Claude puede lograr.
Los analistas de la industria ven la contratación como un indicador para la guerra de talentos más amplia entre las potencias de la inteligencia artificial. A medida que Anthropic sigue atrayendo a investigadores de alto perfil, puede obligar a sus rivales a redoblar sus estrategias de retención y explorar enfoques novedosos para la eficiencia del modelo.
Si la estrategia de preentrenamiento centrada en Claude de Anthropic cumplirá con su promesa sigue siendo algo por verse, pero la participación de Karpathy agrega una capa de credibilidad al ambicioso plan de ruta de la empresa. Por ahora, la comunidad de inteligencia artificial observa de cerca cómo una de las figuras más reconocidas del campo asume un rol que podría redefinir cómo se construyen los grandes modelos de lenguaje.
Dieser Artikel wurde mit Unterstützung von KI verfasst.
News Factory SEO hilft Ihnen, Nachrichteninhalte für Ihre Website zu automatisieren.