A empresa parisiense Mistral lançou o OCR 4 em 23 de junho, posicionando o novo modelo como uma solução específica para a tediosa papelada que impulsiona as operações de back-office empresarial. Diferentemente das ferramentas convencionais de reconhecimento óptico de caracteres que retornam um fluxo plano de texto, o OCR 4 entrega um mapa completo de cada página: caixas delimitadoras que identificam a localização exata de cada linha, classificações de blocos que etiquetam títulos, tabelas, equações ou assinaturas, e pontuações de confiança por palavra que permitem que os revisores se concentrem em seções incertas.
A saída do modelo chega como markdown limpo, tornando fácil para os desenvolvedores alimentar os dados em pipelines de geração aumentada de recuperação (RAG) ou outros agentes de inteligência artificial que precisam entender não apenas o que um documento diz, mas como ele é organizado. Os primeiros adotantes já estão usando o OCR 4 para digitalizar arquivos, extrair campos de faturas e retirar texto estruturado de relatórios científicos.
Construído para o back-office
Equipes de back-office exigem precisão e velocidade. A Mistral relata que a Anaqua, uma provedora de software de depósito de propriedade intelectual, vê o novo modelo processando páginas aproximadamente quatro vezes mais rápido do que sua ferramenta anterior, um ganho que pode fazer a diferença em ambientes de docketing de alto volume. O sistema lida com PDFs, Microsoft Word, PowerPoint e formatos OpenDocument, e lê 170 idiomas em dez grupos de idiomas, incluindo línguas de baixo recurso onde os concorrentes lutam.
O preço reflete o foco no trabalho em volume. A API custa $4 por 1.000 páginas, caindo para $2 no modo de lote, enquanto uma oferta de inteligência artificial de documento de nível superior que reformula a saída em campos personalizados custa $5 por 1.000 páginas. Uma empresa de pesquisa financeira, Rogo, alegou precisão comparável à de seu provedor anterior a um custo de aproximadamente um oitavo.
A auto-hospedagem é um ponto de venda fundamental. O OCR 4 se encaixa em um único container, permitindo que bancos, hospitais, governos e outras organizações sensíveis a dados mantenham os documentos localmente e evitem as preocupações de residência relacionadas aos provedores de nuvem dos EUA. A Mistral comercializa o modelo como a alternativa soberana europeia à inteligência artificial americana, uma afirmação reforçada pela parceria da empresa com a Microsoft, que destacou o lançamento como um marco na colaboração com o campeão francês de inteligência artificial.
A distribuição é feita por meio do próprio estúdio da Mistral, Amazon SageMaker, Microsoft Foundry e, em breve, Snowflake. O modelo também se conecta à nova ferramenta de busca da Mistral, um framework de código aberto que permite que os desenvolvedores alimentem a saída estruturada do OCR diretamente em pipelines de citação pronta.
Os benchmarks mostram o OCR 4 liderando as pontuações públicas do OlmOCRBench em 85,20 e vencendo 72% das comparações julgadas por humanos contra sistemas concorrentes. A Mistral alerta que os números são "direcionais", observando que o benchmark pode subestimar equações matemáticas e layouts de múltiplas colunas. A empresa também enfatiza que o OCR 4 é uma ferramenta de leitura, não um sistema de tomada de decisão; é inadequado para diagnóstico médico, julgamento legal ou finanças de alto risco sem supervisão humana.
O mercado de inteligência artificial de documento permanece congestionado, com a Google, AWS e uma onda de startups oferecendo produtos concorrentes. Os diferenciais da Mistral - saída estruturada, preço baixo e auto-hospedagem - visam conquistar empresas que precisam tanto de desempenho quanto de soberania de dados. Se a abordagem pode capturar uma participação significativa das cargas de trabalho de back-office contra os grandes incumbentes de nuvem será desvendado nos próximos meses, mas por agora a empresa francesa colocou a tarefa tediosa, mas essencial, do processamento de documentos no centro de sua estratégia de inteligência artificial.
Este artigo foi escrito com a assistência de IA.
News Factory APP - notícias agênticas para impulsionar seu SEO e AEO.