スマートOCRのシステムフロースマートOCRによって非定型紙帳票(請求書・発注書等)をデータ化する流れをご紹介します。
私たちはスマートOCRによって社会に貢献していきたいと考えています。
スマートOCRでデータ化する流れ
4つの入力(アップロード)方法
スマートOCRには大きく分けて4つのアップロード方法があります。
複合機から複数帳票をスキャニングし、アップロードすることが可能です。「歪み補正」や、「アップロードと同時にOCR依頼」も行うことができます。
![WEB(ブラウザ上)](../img/system/img01.jpg)
毎回アップロードを行う必要はなく、フォルダ指定を行うだけで自動アップロード〜OCR変換〜CSV出力までできます。
インターネットFAXサービス連携、メール添付ファイルの自動アップロードも可能です。
RPAを利用しなくとも、シンプルにアップロードの自動化を実現可能です。
![自動アップロード(デスクトップアプリ)](../img/system/img02.jpg)
その場で撮影しアップロードすれば、社内の経理部の方がPCで確認し、経理システムへ反映することも可能です。
![スマホアプリ(iOS,Android)](../img/system/img03.jpg)
![API](../img/system/img04.jpg)
![↓](../img/system/arrow-btm.png)
OCR変換前の画像の処理
スマートOCRでは、OCR変換精度を向上させるため様々な画像の前処理が行われます。
![前処理(OCR変換前)](../img/system/img05.jpg)
![↓](../img/system/arrow-btm.png)
文字認識・文字領域(OCR変換後)・自然言語解析処理・構造化
独自開発のOCRエンジンにより、高精度な文字認識を可能とします。
Deep Learning (AI )による高精度文字認識を行います。また、画像認識と自然言語処理による文字の並びも含めた文字認識により高精度の認識が可能です。
例)白文字、網掛け文字、透かし文字、はなれ文字、隣接文字・罫線隣接文字、手書き文字、印影除去
![①高度な文字認識エンジン、文字列単位認識エンジン(インフォディオ 独自開発](../img/system/img06.jpg)
Deep Learning (AI )による自動文字列認識機能によりノイズがある画像でも文字列だけを探し出して、テキストに変換することが可能です。
![②文字列エリア自動認識エンジン](../img/system/img07.jpg)
![↓](../img/system/arrow-btm.png)
文字確認・修正・辞書登録等
ユーザーがスマートOCRシステムのWebブラウザ画面上にて
OCR変換されたドキュメントの確認・修正・辞書登録等を行います。
OCR変換後の確認
従来のOCRソフトのように、座標指定による帳票定義設定の必要がありません。ページ中のOCR結果データのすべてを対象として、文字の位置や表組を考慮した自動処理により、スプレッドシート状の表示にてOCR読み取り結果を示します。
![スプレッドシート機能](../img/system/img08.jpg)
スマートOCRの画面上でドキュメント画像とOCR変換結果データは連動して表示され、直感的な確認・修正操作が可能です。
![データ抽出画面](../img/system/img09.jpg)
帳票ごとのステータス別にファイルを絞り込んで表示することができます。
![ステータス表示](../img/system/img10.jpg)
帳票から必要データを抽出した結果を検索することができ、一括でCSVダウンロードすることも可能です。
![確定データ一覧](../img/system/img11.jpg)
OCRの信憑率を色分けして表示します。OCR変換結果の正誤を確認する際の目安として活用することが可能です。
![OCR認識率表示](../img/system/img12.jpg)
・誤り辞書機能…同様の誤認識が発生した際に正解文字列に一律置換
・辞書機能…自然言語学習(定期的に実行)で4文字以上の語は正解率が向上
![誤認識した言葉の登録](../img/system/img13.jpg)
OCR変換後のデータ抽出、マスター機能
アップロードした各帳票のOCR結果から、利用したい項目のデータのみを抽出することが可能です。
例)「請求日:2019/03/15」を抽出したい場合、キー:「請求日」バリュー:「2019/03/15」を設定します。
![データ抽出(キーバリューデータ)](../img/system/img14.jpg)
「マスター画面」にてマスターテーブルを登録することで、データ抽出にて「マスター連携」を利用できます。例えば、経理部の突合作業やデータ連携に便利です。
例)「会社名」をキーに「会社コード」「担当者名」を表示します。
![データ抽出(表データ)](../img/system/img15.jpg)
![↓](../img/system/arrow-btm.png)
データ出力
OCR変換された構造化データをエクセルで読込可能なデータ(csv形式)に出力できます。
また、お客様の基幹システムへのデータ連携・RPA連携ができるように、詳細な出力形式のカスタマイズ開発も可能です。
各帳票ファイルの表示画面から、個別にCSV出力することが可能です。
![スプレッドシート機能](../img/system/img16.jpg)
同一のデータ抽出テンプレートを使用した各帳票のデータを、一括したCSVファイルとして一度にダウンロードすることが可能です。
![データ抽出画面](../img/system/img17.jpg)
シームレスなデータ連携を実現するWeb-APIを提供しています。
![スプレッドシート機能](../img/system/img18.jpg)
デスクトップアプリでアップロードとOCR処理、CSVデータのダウンロードまでを自動化することが可能です。
![データ抽出画面](../img/system/img19.jpg)
スマートOCRに関する詳しい資料・価格表
![スマートOCR資料請求](../img/top/block11.png)