Probablemente, una startup de inteligencia artificial con sede en San Francisco, cerró una ronda de semilla de $9 millones el lunes, con Andreessen Horowitz liderando la inversión. El capital acelerará la misión de la empresa para eliminar las alucinaciones -salidas fabricadas o inexactas- de los grandes modelos de lenguaje (LLM) y lograr el tipo de precisión del 99,99 % tradicionalmente visto solo en sistemas deterministas.
El fundador y CEO Peter Elias explicó que el primer producto en la línea es una herramienta de ciencia de datos diseñada para generar respuestas rápidas y confiables desde conjuntos de datos complejos. Cada respuesta incluye una cita y una auditoría completa, una característica que se está convirtiendo rápidamente en estándar entre las plataformas de análisis impulsadas por IA. Lo que distingue a Probablemente, dijo Elias, es un "arnés ingenierizado" que verifica las respuestas iniciales del LLM contra un validador determinista. Cualquier resultado que no coincida con los datos subyacentes es rechazado, creando un bucle de retroalimentación que entrena al modelo para mantenerse dentro de los límites de la corrección factual.
"La mejor ingeniería de arnés que tengas, el modelo más débil puede ser", dijo Elias a los reporteros. Al refinar el contexto y reducir la ambigüedad, el sistema puede confiar en un modelo que es "cuatro clases más débil que los modelos de vanguardia". Esta reducción del tamaño del modelo significa que el software puede ejecutarse en una computadora de escritorio típica en lugar de un servidor de centro de datos de grado, lo que reduce drásticamente los costos de tokens y hace que la tecnología sea accesible para empresas más pequeñas.
La financiación también apoyará la expansión a otros dominios sensibles a la precisión. Elias vislumbra el mismo motor de validación impulsando aplicaciones en contabilidad, diagnósticos médicos y cualquier campo donde la salida de IA errónea pueda tener consecuencias costosas. "Cualquier caso de uso sensible a la precisión", dijo, "es un ajuste natural para nuestro enfoque".
Los observadores de la industria señalan que los principales laboratorios de IA han evitado en gran medida construir capas de validación como esta porque sus modelos de negocio se benefician de las actualizaciones de modelo frecuentes y el trabajo de corrección asociado. La estrategia de Probablemente, por contraste, busca minimizar las correcciones posteriores a la implementación, posicionando a la empresa como una alternativa rentable para las organizaciones que dudan de los gastos de IA en aumento.
El socio de Andreessen Horowitz, John Doe, quien lideró la ronda, elogió la mentalidad de ingeniería en primer lugar de Probablemente. "Estamos apostando por un futuro en el que la IA pueda ser confiable para tareas críticas de la misión", comentó. La asociación también dará a Probablemente acceso a la extensa red de clientes empresariales de la firma, lo que podría acelerar la adopción en industrias reguladas.
Mientras que la ronda de semilla marca un hito significativo, Elias advirtió que el viaje hacia una IA verdaderamente confiable es continuo. La startup planea iterar sobre su sistema de validador, integrar más conjuntos de datos específicos de dominio y explorar asociaciones con fabricantes de hardware para optimizar aún más la implementación local.
Si tiene éxito, la tecnología de Probablemente podría cambiar la forma en que las empresas evalúan las soluciones de IA, pasando del enfoque en el tamaño del modelo a la robustez de la arquitectura de validación circundante. Por ahora, la infusión de $9 millones proporciona la pista de aterrizaje necesaria para demostrar que un modelo más pequeño y bien arnesado puede entregar la precisión que las empresas demandan.
Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.