スマートOCRのシステムフロースマートOCRによって非定型紙帳票(請求書・発注書等)をデータ化する流れをご紹介します。
私たちはスマートOCRによって社会に貢献していきたいと考えています。

4つの入力(アップロード)方法
4つの入力(アップロード)方法
①WEB(ブラウザ上)

複合機から複数帳票をスキャニングし、アップロードすることが可能です。「歪み補正」や、「アップロードと同時にOCR依頼」も行うことができます。

WEB(ブラウザ上)
②自動アップロード(デスクトップアプリ)

毎回アップロードを行う必要はなく、フォルダ指定を行うだけで自動アップロード〜OCR変換〜CSV出力までできます。

自動アップロード(デスクトップアプリ)
③スマホアプリ(iOS,Android)

その場で撮影しアップロードすれば、社内の経理部の方がPCで確認し、経理システムへ反映することも可能です。

スマホアプリ(iOS,Android)
④API

スマートOCRは、Web画面を介さずにAPIにより直接アップロード処理を行うことが可能です。

salesforce連携について
API
↓
データ出力
前処理(OCR変換前)
仮装罫線処理、印影除去、手書き文字、歪み補正、台形補正、自動回転、部分切り出し

OCR変換前に画像・ノイズ処理を行います。

各機能について
前処理(OCR変換前)
データ出力
文字認識・文字領域(OCR変換後)
ー自然言語解析処理、構造化ー
①高度な文字認識エンジン、文字列単位認識エンジン(インフォディオ 独自開発)

Deep Learning (AI )による高精度文字認識を行います。また、画像認識と自然言語処理による文字の並びも含めた文字認識により高精度の認識が可能です。
例)白文字、網掛け文字、透かし文字、はなれ文字、隣接文字・罫線隣接文字、手書き文字、印影除去

文字認識、文字列単位認識
①高度な文字認識エンジン、文字列単位認識エンジン(インフォディオ 独自開発
②文字列エリア自動認識エンジン

Deep Learning (AI )による自動文字列認識機能によりノイズがある画像でも文字列だけを探し出して、テキストに変換することが可能です。

②文字列エリア自動認識エンジン
文字確認・修正・辞書登録等
文字確認・修正・辞書登録等

ユーザーがスマートOCRシステムのWebブラウザ画面上にて
OCR変換されたドキュメントの確認・修正・辞書登録等を行います。

OCR変換後の確認

①スプレッドシート機能

従来のOCRソフトのように、座標指定による帳票定義設定の必要がありません。ページ中のOCR結果データのすべてを対象として、文字の位置や表組を考慮した自動処理により、スプレッドシート状の表示にてOCR読み取り結果を示します。

スプレッドシート機能
②データ抽出画面

スマートOCRの画面上でドキュメント画像とOCR変換結果データは連動して表示され、直感的な確認・修正操作が可能です。

データ抽出画面
③ステータス表示

帳票ごとのステータス別にファイルを絞り込んで表示することができます。

ステータス表示
④確定データ一覧

帳票から必要データを抽出した結果を検索することができ、一括でCSVダウンロードすることも可能です。

確定データ一覧
⑤OCR信憑率表示

OCRの信憑率を色分けして表示します。OCR変換結果の正誤を確認する際の目安として活用することが可能です。

OCR認識率表示
⑥誤認識した言葉の登録
誤認識の箇所は、修正後に以下の登録を行うことで、次回以降の精度向上につなげることができます。
・誤り辞書機能…同様の誤認識が発生した際に正解文字列に一律置換
・辞書機能…自然言語学習(定期的に実行)で4文字以上の語は正解率が向上
誤認識した言葉の登録

OCR変換後のデータ抽出、マスター機能

①データ抽出(キーバリューデータ/表データ)

アップロードした各帳票のOCR結果から、利用したい項目のデータのみを抽出することが可能です。
例)「請求日:2019/03/15」を抽出したい場合、キー:「請求日」バリュー:「2019/03/15」を設定します。

データ抽出(キーバリューデータ)
②マスター機能(キーバリューデータ/表データ)

「マスター画面」にてマスターテーブルを登録することで、データ抽出にて「マスター連携」を利用できます。例えば、経理部の突合作業やデータ連携に便利です。
例)「会社名」をキーに「会社コード」「担当者名」を表示します。

データ抽出(表データ)
データ出力
データ出力

OCR変換された構造化データをエクセルで読込可能なデータ(csv形式)に出力できます。
また、お客様の基幹システムへのデータ連携・RPA連携ができるように、詳細な出力形式のカスタマイズ開発も可能です。

①個別出力

各帳票ファイルの表示画面から、個別にCSV出力することが可能です。

スプレッドシート機能
②データ一括出力

同一のデータ抽出テンプレートを使用した各帳票のデータを、一括したCSVファイルとして一度にダウンロードすることが可能です。

データ抽出画面

スマートOCRに関する詳しい資料・価格表

スマートOCR資料請求
「スマートOCR」の製品概要・エンジン・マルチな機能等の詳しい内容や、料金プランにつきましてはこちらからお気軽にお問い合わせ下さい。
AI-OCR「スマートOCR(smartOCR)」