スマートOCRのシステムフロースマートOCRによって非定型紙帳票(請求書・発注書等)をデータ化する流れをご紹介します。
私たちはスマートOCRによって社会に貢献していきたいと考えています。

スマートOCRでデータ化する流れ

01UPLOADファイルのアップロード

4つの入力(アップロード)方法

スマートOCRには大きく分けて4つのアップロード方法があります。

①WEB(ブラウザ上)

複合機から複数帳票をスキャニングし、アップロードすることが可能です。「歪み補正」や、「アップロードと同時にOCR依頼」も行うことができます。

WEB(ブラウザ上)
②自動アップロード(デスクトップアプリ)

毎回アップロードを行う必要はなく、フォルダ指定を行うだけで自動アップロード〜OCR変換〜CSV出力までできます。

インターネットFAXサービス連携、メール添付ファイルの自動アップロードも可能です。

RPAを利用しなくとも、シンプルにアップロードの自動化を実現可能です。

自動アップロード(デスクトップアプリ)
③スマホアプリ(iOS,Android)

その場で撮影しアップロードすれば、社内の経理部の方がPCで確認し、経理システムへ反映することも可能です。

スマホアプリ(iOS,Android)
④API

スマートOCRは、Web画面を介さずにAPIにより直接アップロード処理を行うことが可能です。

salesforce連携について
API
↓
02PREPROCESSING前処理(OCR変換前)

OCR変換前の画像の処理

スマートOCRでは、OCR変換精度を向上させるため様々な画像の前処理が行われます。

仮装罫線処理、印影除去、手書き文字、歪み補正、台形補正、自動回転、部分切り出し

OCR変換前に画像・ノイズ処理を行います。

各機能について
前処理(OCR変換前)
↓
03OCR文字認識・文字領域

文字認識・文字領域(OCR変換後)・自然言語解析処理・構造化

独自開発のOCRエンジンにより、高精度な文字認識を可能とします。

①高度な文字認識エンジン、文字列単位認識エンジン(インフォディオ 独自開発)

Deep Learning (AI )による高精度文字認識を行います。また、画像認識と自然言語処理による文字の並びも含めた文字認識により高精度の認識が可能です。
例)白文字、網掛け文字、透かし文字、はなれ文字、隣接文字・罫線隣接文字、手書き文字、印影除去

文字認識、文字列単位認識
①高度な文字認識エンジン、文字列単位認識エンジン(インフォディオ 独自開発
②文字列エリア自動認識エンジン

Deep Learning (AI )による自動文字列認識機能によりノイズがある画像でも文字列だけを探し出して、テキストに変換することが可能です。

②文字列エリア自動認識エンジン
↓
04VERIFICATION文字確認・修正・辞書登録等

文字確認・修正・辞書登録等

ユーザーがスマートOCRシステムのWebブラウザ画面上にて
OCR変換されたドキュメントの確認・修正・辞書登録等を行います。

OCR変換後の確認

①スプレッドシート機能

従来のOCRソフトのように、座標指定による帳票定義設定の必要がありません。ページ中のOCR結果データのすべてを対象として、文字の位置や表組を考慮した自動処理により、スプレッドシート状の表示にてOCR読み取り結果を示します。

スプレッドシート機能
②データ抽出画面

スマートOCRの画面上でドキュメント画像とOCR変換結果データは連動して表示され、直感的な確認・修正操作が可能です。

データ抽出画面
③ステータス表示

帳票ごとのステータス別にファイルを絞り込んで表示することができます。

ステータス表示
④確定データ一覧

帳票から必要データを抽出した結果を検索することができ、一括でCSVダウンロードすることも可能です。

確定データ一覧
⑤OCR信憑率表示

OCRの信憑率を色分けして表示します。OCR変換結果の正誤を確認する際の目安として活用することが可能です。

OCR認識率表示
⑥誤認識した言葉の登録
誤認識の箇所は、修正後に以下の登録を行うことで、次回以降の精度向上につなげることができます。
・誤り辞書機能…同様の誤認識が発生した際に正解文字列に一律置換
・辞書機能…自然言語学習(定期的に実行)で4文字以上の語は正解率が向上
誤認識した言葉の登録

OCR変換後のデータ抽出、マスター機能

①データ抽出(キーバリューデータ/表データ)

アップロードした各帳票のOCR結果から、利用したい項目のデータのみを抽出することが可能です。
例)「請求日:2019/03/15」を抽出したい場合、キー:「請求日」バリュー:「2019/03/15」を設定します。

データ抽出(キーバリューデータ)
②マスター機能(キーバリューデータ/表データ)

「マスター画面」にてマスターテーブルを登録することで、データ抽出にて「マスター連携」を利用できます。例えば、経理部の突合作業やデータ連携に便利です。
例)「会社名」をキーに「会社コード」「担当者名」を表示します。

データ抽出(表データ)
↓
05EXPORTデータ出力

データ出力

OCR変換された構造化データをエクセルで読込可能なデータ(csv形式)に出力できます。
また、お客様の基幹システムへのデータ連携・RPA連携ができるように、詳細な出力形式のカスタマイズ開発も可能です。

①個別出力

各帳票ファイルの表示画面から、個別にCSV出力することが可能です。

スプレッドシート機能
②データ一括出力

同一のデータ抽出テンプレートを使用した各帳票のデータを、一括したCSVファイルとして一度にダウンロードすることが可能です。

データ抽出画面
③API連携

シームレスなデータ連携を実現するWeb-APIを提供しています。

スプレッドシート機能
④自動CSV出力

デスクトップアプリでアップロードとOCR処理、CSVデータのダウンロードまでを自動化することが可能です。

データ抽出画面

スマートOCRに関する詳しい資料・価格表

スマートOCR資料請求
「スマートOCR」の製品概要・エンジン・マルチな機能等の詳しい内容や、料金プランにつきましてはこちらからお気軽にお問い合わせ下さい。
AI-OCR「スマートOCR(smartOCR)」