Laboratorios de IA en todo el mundo están enfocando su atención en la auto-mejora recursiva (RSI), un concepto que imagina máquinas que pueden mejorar continuamente sin intervención humana. El impulso refleja la hiperexpectación que una vez rodeó a la inteligencia artificial general, pero los obstáculos técnicos siguen siendo formidables.

Este mes, el ex investigador de Meta y Salesforce, Richard Socher, anunció el lanzamiento de Recursive Superintelligence, una empresa explícitamente construida alrededor de la RSI. Socher le dijo a TechCrunch que el objetivo es automatizar toda la tubería de investigación - ideación, implementación y validación - para que el sistema pueda mejorar a gran escala sin supervisión humana.

Paralelamente al esfuerzo de Socher, el ex líder de Tesla y OpenAI, Andrej Karpathy, está ejecutando un proyecto que llama Auto-Investigación. Al desplegar enjambres de agentes para entrenar grandes modelos de lenguaje en tareas modestas, Karpathy espera lograr mejoras incrementales que eventualmente podrían convertirse en un bucle de auto-mejora. Ha sido inusualmente transparente, publicando hitos en Twitter y liberando código en GitHub. Hasta ahora, las mejoras se encuentran en un nivel de GPT-2, y Karpathy admite que no son "nuevas, innovadoras \'investigaciones\' (todavía)".

Adaption, una startup fundada por la ex alumna de Cohere y Google, Sara Hooker, entró en la arena con AutoScientist, una herramienta que entrena a los agentes para hacer mejoras incrementales en modelos de lenguaje de frontera. El objetivo es similar al de Karpathy: simplificar el entrenamiento de modelos masivos permitiendo que los agentes de IA manejen los pasos de afinamiento que tradicionalmente requieren ingenieros humanos.

Historias de éxito concretas están emergiendo. La fundadora de Disarray, Doris Xin, vio a su agente de aprendizaje automático auto-entrenado capturar 28 medallas en una reciente competencia de Kaggle, superando a muchas entradas entrenadas por humanos. Xin señala la confiabilidad como el principal obstáculo, argumentando que con "cómputo infinito y horizonte de tiempo infinito, ya estamos allí".

Líderes de la industria siguen siendo cautos. El director ejecutivo de Google, Sundar Pichai, en una reciente entrevista de podcast, reconoció el progreso pero advirtió que el tipo de aceleración descrita por la RSI aún está más allá del alcance. "Es un continuum, y todos estamos haciendo progreso", dijo, agregando que el próximo nivel tendría "muchas implicaciones, pero no estamos quite allí todavía".

Herramientas internas de Anthropic sugieren cómo rápidamente se está moviendo el límite. Su sistema Claude Code ahora escribe cerca del 100% del código que sus ingenieros utilizan, efectivamente autorizando a sí mismo. Una encuesta del personal de Anthropic reveló que cinco de 18 ingenieros creen que el próximo modelo Mythos podría reemplazar a un programador de nivel medio (L4), aunque notan debilidades en la auto-administración, la configuración de prioridades y la verificación - habilidades esenciales para la verdadera RSI.

Expertos enfatizan que utilizar IA para asistir en la investigación no equivale a RSI. La directora del Centro de Seguridad y Tecnología Emergente de Georgetown, Helen Toner, le dijo a TechCrunch que "solo están utilizando IA para lo que pueden", lo que no alcanza la definición clásica donde no se necesitan humanos. Ajeya Cotra del Instituto de Investigación de Inteligencia de Máquina describe una hoja de ruta: primero "adecuación", donde una IA puede realizar investigación sola; luego "paridad", igualando el rendimiento humano; y finalmente "supremacía", superando a los equipos humanos-IA colaborativos. Cotra cree que el umbral de adecuación puede estar dentro de unos pocos años, pero la paridad y la supremacía siguen siendo especulativas.

La comunidad sigue dividida sobre los plazos. Un panel de expertos organizado por CSET el año pasado encontró opiniones que variaban desde explosiones de superinteligencia inminentes hasta un progreso más lento y limitado. Todos están de acuerdo, sin embargo, en que la recursividad hace que la predicción sea especialmente difícil.

A medida que se invierte más fondos y se expanden los recursos de cómputo, los desafíos de ingeniería y alineación se alzan como grandes obstáculos. El cómputo infinito no es una realidad, y equilibrar el trabajo humano con la inteligencia de la máquina será una tensión persistente. Por ahora, la auto-mejora recursiva sigue siendo una promesa tentadora - una que el campo de la IA se dirige hacia pero aún no ha capturado completamente.

Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.

Laboratorios de IA se dirigen hacia la auto-mejora recursiva como nueva frontera

Key Points

También disponible en: