Mistral AI于6日正式发布了Mistral OCR API,宣称其在光学字符识别(OCR)领域表现卓越。该API具备强大的多模态文档处理能力,能够从PDF、幻灯片、数学表达式、LaTeX学术文档等复杂文档中高效提取文本内容,并以Markdown文件的形式清晰呈现。Mistral OCR模型支持解析、理解和转录数千种脚本、字体和语言,现有版本在识别精度上已超越谷歌Document AI、微软Azure OCR、OpenAI GPT-4o等竞争对手。此外,Mistral AI已将Mistral OCR作为其Le Chat聊天机器人的默认文档理解模型,定价为每千页1美元,单节点每分钟可处理2000页,目前已应用于历史文化遗产保护等多个场景。