メインコンテンツに移動
ホーム
AI News Japan

メインナビゲーション

  • ホーム
  • AI用語ミニ辞典
  • このサイトについて
  • プロフィール
ユーザーアカウントメニュー
  • ログイン

パンくず

  1. ホーム

Mistral「OCR 4」公開 ― 日本語含む170言語、文字の位置と信頼度も出力

By ちゃぴお , 28 6月 2026

◀ AIニュースまとめ(2026.06.20–06.24)に戻る

フランスの Mistral が、文書解析OCR(画像から文字を読み取る技術)の新版である OCR 4 を2026年6月23日に公開しました。日本語を含む170言語に対応していて、文字の位置や読み取りの自信度まで出力できます。

何ができるのか

OCR 4 は、PDF や Word、PowerPoint、OpenDocument などの文書から、文字とレイアウト構造をまとめて抜き出してくれます。前の版の OCR 1(2025年3月)からの目玉が、(1) 文字の位置を示す バウンディングボックス(囲み枠)、(2) 見出しや表、数式、署名といった 要素の種類分け、(3) ページや単語ごとの 信頼度スコア(読み取りの自信度) の追加です。これによって、ただ文字を起こすだけでなく、どこに・何の要素として・どれくらい確かに読めたかが分かるようになりました。

文書 → 構造化されたデータへ 表 入力:PDF / Word / PPT … 見出し・本文を抽出 表・数式・署名を種類分け 文字の位置(囲み枠) 信頼度スコア(自信度) 170言語 日本語も対応 勝率72% 人間評価で競合比 $4 / 1000頁 バッチは半額の$2
▲ 文字起こしに加え、要素の種類・位置・信頼度まで構造化して返す

性能と料金

人間による比較評価では、競合に対して 平均72%の勝率 を記録しました。文書OCRのベンチマークでも、OlmOCRBench で 85.20、OmniDocBench で 93.07 のスコアを出しています。料金は 1000ページあたり4ドルで、まとめて処理するバッチ版なら半額の 2ドル です(前の版の OCR 1 は1ドルでした)。提供方法は API のほか、Mistral Studio や Amazon SageMaker、Microsoft Foundry 経由でも使えて、Snowflake への対応も予定されています。なお、医療の診断や法的な判断、重要な金融の判断のような用途には向かないという注意書きもあります。

背景

OCR は、請求書や契約書、申請書類など、紙やPDFの山をデータに変える、地味ですが需要の大きい技術です。文字を起こすだけなら以前からありますが、表なのか署名なのか、どこに書かれていたか、どれくらい確かに読めたか まで分かると、人が後から確認したり修正したりする手間が大きく減ります。信頼度スコアが低い箇所だけ人がチェックする、といった効率的な使い方ができます。日本語を含む170言語に対応しているので、日本の事務作業の自動化にも使いやすいなと思います。

用語ミニ解説

  • OCR:画像やPDFの中の文字を読み取って、テキストに変換する技術です。光学文字認識の略になります。
  • バウンディングボックス:この文字はこの位置にあった、と示す囲み枠のことです。読み取った文字が元の文書のどこにあったかが分かります。
  • 信頼度スコア:AIが、この読み取りはどれくらい確かかを数値で示したものです。低い箇所だけ人が確認する、といった使い分けができます。

出典

  • ITmedia AI+ ― Mistral、文書解析OCRの新版OCR 4公開

タグ

  • AIニュース
  • モデル発表
  • プロダクト

コメント

制限付き HTML

  • 使用できるHTMLタグ: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • 行と段落は自動的に折り返されます。
  • ウェブページのアドレスとメールアドレスは自動的にリンクに変換されます。

モジュール検証

  • モジュール検証レポート

備忘録

  • 第8回備忘録
  • 第7回備忘録
  • 第6回備忘録
  • 第5回備忘録
  • 第4回備忘録
  • 第3回備忘録
  • 第2回備忘録
  • 最初の備忘録

関連記事

  • OpenAI「GPT-5.6 Sol」を予告 ― 次世代モデルの狙い
  • 日本のフィジカルAI連合「Noetra」が始動 ― 5年で製造・医療・物流へ
  • Anthropic、Samsungと独自AIチップを協議 ― Nvidia依存を薄める流れ
  • Microsoft、25億ドルでAI導入会社「Frontier」を設立

AI News Japan

Hacker News・TechCrunch・ITmedia・各社公式ブログなどから、毎週話題のAIニュースをまとめてお届けする学生運営のニュースサイトです。

📡 RSSで購読する

運営:ちゃぴお / © 2026 AI News Japan