维度网讯,法国人工智能公司 Mistral AI 于周二发布其第四代光学字符识别模型 OCR 4。该模型的核心能力不仅限于文本提取,还能返回包含边界框、块类型分类及逐词置信度得分的文档结构化表示。产品定位于受监管行业的自托管企业部署市场,这些企业无法将敏感文档交给美国司法管辖下的云服务商处理。

OCR 4 支持 10 个语系的 170 种语言,可处理 PDF、DOC、PPT 及 OpenDocument 格式。Mistral 表示,前几代产品主要将页面转换为干净的文本和表格,而 OCR 4 则直接返回文档的结构化表示。该模型已通过 Mistral API、Mistral Studio 中的 Document AI、Amazon SageMaker 及 Microsoft Foundry 提供,Snowflake Parse Document 支持即将推出。定价为每 1000 页 4 美元起,批量 API 折扣价为每 1000 页 2 美元。
OCR 4 的工程核心是输出分层的文档表示,而非扁平的文本流。每个文本块均附带边界框定位、类型分类(如标题、表格、公式、签名)以及页面和单词级别的置信度评分。Mistral 表示,边界框是客户最常要求的功能,它能让下游系统将提取信息追溯到特定页面位置。块分类功能则允许将标题段落用于语义搜索中的层级分割,将表格块路由至结构化数据流水线,而签名块则可用于触发合规系统中的编辑工作流。置信度评分使组织能够以编程方式将低置信度区域交给人工审核,同时自动批准高置信度提取。
在独立评估中,Mistral 报告称,由独立标注员对超过 600 份包含 12 种以上语言的真实文档进行的人工评估显示,OCR 4 在与主要竞争对手的直接比较中实现了 72% 的平均胜率。该模型在 OlmOCRBench 上获得 85.20 分,在 OmniDocBench 上获得 93.07 分。不过,Mistral 也主动审计并公开披露了评分中存在的伪影问题,包括参考标注中的错误、LaTeX 符号匹配问题、列阅读顺序假设等,并认为总分仅具方向性而非确定性。值得注意的是,在公开的 OlmOCRBench 排行榜上,OCR 4 目前排名第三,落后于部分开放权重模型,如 Chandra OCR 2。PaddleOCR-VL-1.6 自称在 OmniDocBench 上综合得分达到 96.33。
早期企业反馈提供了具体数据。金融 AI 公司 Rogo 的 AI 工程师 Aidan Donohue 称,在图表密集的金融问答数据集上,OCR 4 与领先的代理文档解析器相比,“在成本降低约 8 倍、延迟降低约 17 倍的情况下达到同等精度”。知识产权管理公司 Anaqua 的 AI 工程师 Ivan Mihailov 则表示,OCR 4 的“每页速度大约是现有供应商的 4 倍”。
此次发布的地缘政治背景是 6 月 12 日 Anthropic 因美国出口管制禁用其最新模型 Fable 5 和 Mythos 5,导致金融、医疗及关键基础设施领域的企业客户服务中断。这一事件验证了 Mistral 首席执行官 Arthur Mensch 关于欧洲对美国 AI 公司依赖风险的警告。Mensch 曾表示,美国公司“掌握着他们模型的关键”,并在近期强调“欧洲在基础设施的建设方面落后了,所以我们正在投资以缩小这一差距”。OCR 4 的单容器自托管部署模式使文档无需离开客户基础设施,完全在欧盟管辖下运行。
在 Mistral 发布的前一天,百度推出了一款名为 Unlimited-OCR 的 30 亿参数模型,采用 MIT 许可免费开放权重。该模型使用一种称为参考滑动窗口注意力(R-SWA)的技术,能够在一次前向传递中解析整个 PDF 和多页扫描件,无需分块或拼接。这两个发布被分析人士视为 2026 年 6 月文档 AI 领域的两种模式分化:开放权重的自托管长程解析与商业化的结构化托管提取。对于单个 GPU 上的研究团队而言,Unlimited-OCR 可能更合适,而 OCR 4 则面向企业 IT 采购流程中涉及的服务级别协议、数据处理协议和合规审计。
从产业角度看,OCR 4 是 Mistral 进入企业 AI 预算的切入点。该模型直接支持 Mistral 的 Search Toolkit,即一个开源可组合搜索框架。在架构上,OCR 4 担任检索增强生成和企业搜索流水线的提取层。彭博社近期报道称,Mistral 正处于早期谈判阶段,计划以约 200 亿欧元的估值融资约 30 亿欧元。该公司目标是 2026 年实现 10 亿欧元收入。Mistral CEO 近期还反驳了教皇关于 AI 应被“解除武装”的呼吁,认为欧洲不能落后于美国科技巨头,需要拥有自己的 AI 能力。



本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









