VR视角 欧洲“DeepSeek”发布了全宇宙最佳的 OCR,网友:蹲蹲中国的免费开源版
发布日期:2025-03-18 00:21 点击次数:187
就在刚刚VR视角,阿谁也曾开源了首个 MoE 模子的欧洲初创公司 Mistral AI 在千里寂一段时候之后又出新活。
Mistral 团队发布了一个堪称“全宇宙最佳的 OCR”的居品 —— Mistral OCR,旨在将一些 AI 难以奏凯识别的豪爽且复杂的文献进行整理,便于 AI 操作识别。
帖子照旧发出,批驳区转眼充满了各式夸夸言论,但在一众奖饰声中,也不乏一些着实用过居品的网友的千里着安详发言。
就比如有网友对 Mistral OCR 的居品才调示意招供,但却有点接受不了它的居品订价,认为有点太贵,而况期待中国 AI 公司早点发布一个访佛的开源版块,把价钱打下来。
同期也有网友躬行上手,上传扫描了手写板的本色,但终末识别出的笔墨成果正确率并不是很高。
除此除外,还有被 Mistral 所宣传的“不错识别超多种话语”噱头眩惑过来的网友,但使用后却失望的发现它无法识别我方所用话语。
尽管 Mistral OCR 当今还存在着一定的局限性,但它的出现照实是一次从字符识别到场景智能的逾越。
从图文到结构化数据的一大步
与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅不错识别文本中是否镶嵌了插图或相片,还会为这些图形元素创建界限框,并将它们包含在输出中。
从 Mistral AI 团队放出的 Demo 视频不错看出,Mistral OCR 大概将图文混排的 PDF 文献休养成结构明晰的 Markdown 款式文献。
举例表格+数字的 PDF 组合。
PDF 图片中数学公式的休养。
PDF 宣传图片中的印地语VR视角。
拍得并不梗直的论文相片。
以致带有水印的笔墨也不错闲散识别。
从字符识别到场景智能的一大步
除了直不雅的 Demo 外,Mistral AI 团队还列举了 6 点 Mistral OCR 的皆备上风:
不凡的复漫笔档流露才调:Mistral OCR 在一语气复漫笔档结构方面进展出色,大概精确流露交错的图像、数学公式、表格以及 LaTeX 等高等排版款式。这使其在治理包含图表、图形、公式和插图的科学论文等富文本文档时更具上风。
原生援救多话语与多模态:Mistral OCR 自带多话语和多模态治理才调,大概活泼应答不同话语以及多种类型的本色,无需出奇适配。
行业起先的基准测试进展:在多项行业基准测试中,Mistral OCR 均取得优异获利,充分展示了其强盛的性能和高准确度。
同类居品中治理速率最快:Mistral OCR 秉承轻量化架构,治理速率远超同类居品,单节点每分钟可流露高达 2000 页文档。不管在高负载环境如故大界限数据治理中,它都能保抓高效出手,确保平稳性能。
翻新性的“文档即教唆”结构化输出:Mistral OCR 率先引入“文档即教唆”主见,使用户大概奏凯使用文档当作指示,羽田爱qvod以赢得愈加精确和定制化的成果。它还能输出 JSON 等结构化款式,便于与后续任务或自动化经由延续,兑现更智能的本色索取。
可选的自托管部署决策:针对数据秘密条件严格的企业或机构,Mistral OCR 提供自托管部署选项,确保明锐信息长久存储在腹地基础要害内,舒合乎规性与安全性需求。
团队还将 Mistral OCR 将 Google Document AI、Azure OCR、Gemini 系列模子以及 GPT-4o 的居品质能进行对比。
最终的成果标明,Mistral OCR 在总体准确率、数学公式识别等方面进展优异,畸形是在 2503 版块中,各项规划均大幅提高,达到了新的高度。
在多话语治理方面,得出的数据更是远远优于 Google Document AI 和 Azure OCR。
欧洲也有我方的“DeepSeek”
Mistral AI 是一家位于法国的初创公司,凭借其 AI 助手 Le Chat 和多个基础模子,已被官方视为法国最具出路的科技公司之一,并被认为是唯独有后劲与 OpenAI 竞争的欧洲企业。
Mistral AI 的三位首创东说念主都领有在大家顶级科技公司中积蓄的丰富 AI 延续警戒。首席施行官 Arthur Mensch 曾在谷歌 DeepMind 部门使命,首席本事官 Timothée Lacroix 和首席科学家 Guillaume Lample 则曾是 Meta 的中枢成员。凭借着广阔的本事配景,Mistral AI 的首创团队率领公司赶紧发展。
值得一提的是,雷峰网(公众号:雷峰网)得知自 2023 年配置以来,Mistral AI 在筹集资金方面取得了权臣获利,场地是将前沿 AI 本事普及给每个东说念主,天然这一场地并未奏凯挑战 OpenAI,但它强调了公司关于 AI 绽开性的顽强援救。
当作 ChatGPT 的替代品,Mistral AI 推出了聊天佑手 Le Chat,并在 iOS 和 Android 上得手上线。在发布后仅两周,Le Chat 的下载量便结巴了 100 万次,并一度在 iOS App Store 中登顶法国免费下载榜单。
除此除外,截止 2025 年 2 月,Mistral AI 已筹集了约 10 亿欧元(约 10.4 亿好意思元)的资金,其中包括几轮股权融资和部分债务融资。尤其值得小心的是,在 2023 年 6 月公司发布首批模子之前,Mistral AI 就得手完成了创记载的 1.12 亿好意思元种子轮融资,成为欧洲历史上最大的一轮种子融资,那时公司估值达 2.6 亿好意思元。
参考衔接:
青柠视频在线观看BDhttps://mistral.ai/fr/news/mistral-ocr
https://x.com/MistralAI/status/1897694143180112096
雷峰网原创著述,未经授权辞谢转载。确定见转载应知。