La empresa con sede en París, Mistral, lanzó OCR 4 el 23 de junio, posicionando el nuevo modelo como una solución diseñada específicamente para la tediosa tarea de papeleo que impulsa las operaciones de oficina trasera de la empresa. A diferencia de las herramientas de reconocimiento óptico de caracteres convencionales que devuelven un flujo plano de texto, OCR 4 entrega un mapa completo de cada página: cuadros delimitadores que señalan la ubicación exacta de cada línea, clasificaciones de bloques que etiquetan títulos, tablas, ecuaciones o firmas, y puntajes de confianza por palabra que permiten a los revisores centrarse en secciones inciertas.
La salida del modelo llega como markdown limpio, lo que facilita a los desarrolladores alimentar los datos a tuberías de generación aumentada de recuperación (RAG) o a otros agentes de inteligencia artificial que necesitan entender no solo lo que dice un documento, sino cómo está organizado. Los adoptadores tempranos ya están utilizando OCR 4 para digitalizar archivos, extraer campos de facturas y extraer texto estructurado de informes científicos.
Diseñado para la oficina trasera
Los equipos de oficina trasera exigen precisión y velocidad. Mistral informa que Anaqua, un proveedor de software de presentación de propiedad intelectual, ve el nuevo modelo procesando páginas aproximadamente cuatro veces más rápido que su herramienta anterior, una ganancia que puede marcar la diferencia en entornos de presentación de alta volumen. El sistema maneja PDF, Microsoft Word, PowerPoint y formatos de OpenDocument, y lee 170 idiomas en diez grupos de idiomas, incluidos lenguas de bajos recursos donde los rivales luchan.
El precio refleja el enfoque en el trabajo de volumen. La API cuesta $4 por 1,000 páginas, bajando a $2 en modo de lotes, mientras que una oferta de inteligencia artificial de documento de nivel superior que reorganiza la salida en campos personalizados cuesta $5 por 1,000 páginas. Una empresa de investigación financiera, Rogo, afirmó una precisión comparable a su proveedor anterior a un costo de aproximadamente una octava parte.
La autoalojabilidad es un punto de venta fundamental. OCR 4 se ajusta a un solo contenedor, lo que permite a bancos, hospitales, gobiernos y otras organizaciones sensibles a los datos mantener los documentos en las instalaciones y evitar las preocupaciones de residencia relacionadas con los proveedores de nube de EE. UU. Mistral comercializa el modelo como la alternativa soberana de Europa a la inteligencia artificial estadounidense, una afirmación reforzada por la asociación de la empresa con Microsoft, que destacó el lanzamiento como un hito en su colaboración con el campeón de inteligencia artificial francés.
La distribución se realiza a través del propio estudio de Mistral, Amazon SageMaker, Microsoft Foundry y, pronto, Snowflake. El modelo también se conecta al nuevo kit de herramientas de búsqueda de Mistral, un marco de código abierto que permite a los desarrolladores alimentar la salida de OCR estructurada directamente a tuberías listas para citar.
Las pruebas de referencia muestran que OCR 4 lidera las puntuaciones públicas de OlmOCRBench con 85,20 y gana el 72 % de las comparaciones juzgadas por humanos contra sistemas competidores. Mistral advierte que las cifras son "direccionales", señalando que el benchmark puede maljuzgar ecuaciones matemáticas y diseños de varias columnas. La empresa también enfatiza que OCR 4 es una herramienta de lectura, no un sistema de toma de decisiones; es inadecuado para el diagnóstico médico, el juicio legal o las finanzas de alto riesgo sin supervisión humana.
El mercado de inteligencia artificial de documentos sigue estando congestionado, con Google, AWS y una oleada de startups que ofrecen productos competidores. Los diferenciales de Mistral - salida estructurada, precio bajo y autoalojabilidad - apuntan a ganar a las empresas que necesitan tanto rendimiento como soberanía de datos. Si el enfoque puede capturar una participación significativa de las cargas de trabajo de oficina trasera contra los incumbentes de la nube más grandes se desarrollará en los próximos meses, pero por ahora la empresa francesa ha colocado la tediosa pero esencial tarea de procesamiento de documentos en el corazón de su estrategia de inteligencia artificial.
Este artículo fue escrito con la asistencia de IA.
News Factory APP - noticias agénticas para impulsar tu SEO y AEO.