AI-OCR「スマートOCR」
コア技術/機能非定型な紙帳票(請求書・発注書等)のデータ化を実現するディープラーニング(人工知能)AI-OCRのコア技術とは

V1V2エンジン比較V1V2エンジン比較

スマートOCR
エンジンの特長

スマートOCRエンジンはAI(人工知能)ディープラーニング技術を用いて、非定型レイアウトの文書(決算書、請求書など)のデータを汎用的にデータ化(RPA)します。 おもに4つの技術から成り立っています。

  • インフォディオ独自のAI-OCR 文字認識エンジン

    インフォディオ独自の
    AI-OCR 文字認識エンジン

    ディープラーニングGAN, RNN, CNNを用いた文字認識エンジン

    学習用文字画像作成システム、文字切出しシステム(ディープラーニング: GAN) と文字認識システム (ディープラーニング: CNN, RNN) を用いた文字認識エンジンを独自開発[特許出願済]
    文字フォント、画質に応じた 文字画像学習を行い、文字認識の精度が向上します。

  • インフォディオ独自のAI-ノイズ処理エンジン

    インフォディオ独自の
    AIノイズ処理エンジン

    ディープラーニングGANを用いたAIノイズ除去エンジン

    敵対的生成ネットワーク(ディープラーニング:GAN)を用いたノイズ除去エンジンを独自開発(特許出願済)。
    文書画像の影・歪みのノイズ処理、網掛け文字処理、反転文字処理、塗りつぶし文字処理、罫線処理が可能となりました。 従来のOCRでは不可能であった高度なノイズ処理を実現します。

  • 非定型レイアウトの処理に対応した自然言語解析・構造化エンジン

    非定型レイアウトの処理に対応した
    自然言語解析・構造化エンジン

    非定型帳票のデータ化システム

    自然言語解析・構造化エンジンの搭載により、認識した文字列に形態素解析、誤認識修正、構造化処理を行います。
    構造化処理により作成された構造化ドキュメントをマッピング処理することにより、取得したい文字列をデータ化することが可能となります。

  • 継続的な機械学習により認識精度向上

    継続的な機械学習により
    認識精度向上

    再学習による文字認識率向上

    スマートOCR WEB管理画面にて、OCR変換後のテキストを確認・修正することができます。
    変換ミスを修正していくことで、OCRエンジンを学習させることが可能で、OCR認識精度が向上します。

特許出願済

ディープラーニングGANとCNNを用いたAI-OCR文字認識エンジン

ディープラーニングGANを用いたノイズ除去エンジン

非定型帳票のデータ化システム

スマートOCRと従来OCRの比較

  スマートOCR 従来のOCR
導入容易性
画像を読み込むとすぐに結果を表示
帳票定義(座標)設定が必要
非定型レイアウト対応
非定型文章でも読取り可能
非定型文章には対応できない
文字認識
ディープラーニングCNN,RNNによる文字認識
従来のベクトル・確率分布等を用いた文字認識
再学習
文字画像を学習させることにより認識率向上
×精度向上はOCRエンジンのバージョンアップが必要
ノイズ処理
AIノイズ処理エンジンにより学習させることで、高度なノイズ除去処理が可能(スキャニング時の影、網掛け、べた塗り、白抜き文字など)
×非AIによるノイズ処理
誤認識修正
自然言語処理(形態素解析、N-GRAM)、辞書登録等による修正
辞書登録による修正

スマートOCR
エンジンの内部フロー

01

AI(ディープラーニングGAN)等を用いた画像前処理

GANの画像復元学習技術を使用して、ノイズ除去、網掛け文字処理、反転文字処理、塗りつぶし文字処理、罫線・点線処といったOCR変換の前処理を行います。

AI(ディープラーニングGAN)等を用いた画像前処理

02

文字切出し・文字認識処理

AI(ディープラーニングGAN)等を用いたエリア認識・文字切出し処理、ディープラーニングCNN, RNN等を用いたAI-OCR認識を行います。

文字切出し・文字認識処理

03

自然言語解析による誤認識修正

OCR変換後、文字列を自然言語解析処理
(N-GRAM、形態素解析、辞書等)により誤認識修正を行います。

自然言語解析による誤認識修正

04

構造化処理

OCRにより文字列に変換されただけでは、データ化(RPA)することが容易ではありません。
枠線、表組み等の位置特性と品詞等の言語特性により、変換した文字列を構造化します。
OCR変換文字列を構造化することにより、データ化(RPA)が容易になります。

構造化処理構造化処理

ドキュメントの構造化

帳票等のドキュメントは単にOCR変換されても連携できる状態のデータにはなりません。ドキュメントは単にOCR変換されてもデータ化(RPA)することはできません。
ドキュメントに階層化特性、品詞・形態素(数値、金額、日付、住所、氏名、会社名、商品名)、位置、類義語などの特性をもたせることにより、必要な項目のデータを抽出することが可能となります。
例えば、”請求金額 (ご請求金額、ご請求額) に論理的に一番近い金額を取り出す”と設定することによって、文書フォーマットが異なった請求書においても、請求金額を抽出することが可能になります。
ドキュメントの構造化

インテリジェント
データ抽出機能

紙帳票画像から、必要なデータを基幹システムへ

スマートOCRのインテリジェントデータ抽出機能は、高精度AI-OCRエンジンで読み取ったテキストデータから必要なデータのみを抽出し、基幹システム、RPA、会計ソフト、汎用データベースなど、さまざまなシステムの入力フォーマットにあわせたデータ出力を可能にします。

スマートOCRはさまざまな非定型帳票を、必要な形式のフォーマットに変換してデータ出力できます

スマートOCRにあらかじめ設定されている抽出条件を使って、キー・バリュー(項目+値)形式や表形式で出力することができます。抽出条件は自由に、直感的な操作でカスタマイズができるので、基幹システムなどの入力フォーマットにあわせたデータ形式で出力することが可能です。

キー・バリュー(項目+値)形式出力

設定情報に基づき、自動的かつ汎用的に、データを取り出します。
出力項目名は統一名にて、データは正規化されるため、基幹システムのデータベースに取り込むことが容易です。

キー・バリュー(項目+値)形式出力

表形式出力

設定した表の抽出条件にもとづいて、帳票の表部分を自動的に読み取ります。列の入れ替えや項目の表示・非表示など、必要な形式の表データを取り出すことができます。

表形式出力

抽出条件の設定は、直感的な操作で簡単にできます

バリューのタイプ、バリュー近傍のキー文字列およびバリューとの位置関係、ページ内の位置等を設定することにより、キーに最も適したバリューデータを抽出します。

バリュー(値)の設定は、あらかじめ用意された9種類のタイプ(文字列、日付、金額、電話、会社名、電話番号、数字、数字&テキスト)から選択するだけで、その特性にあったデータが自動的に抽出されます。

あるキー(項目)に対するバリュー(値)の、帳票内での位置関係(上下左右)を優先付け設定する事で、より正確に抽出が可能になります。

機能一覧

WEBブラウザにより簡単に画面操作ができ、インストールしなくても利用できます。

  • 画像サムネイル表示

  • ファイルアップロード(複数可能)

  • スプレッドシート表示機能

  • OCR認識機能

  • 誤認識文字修正

  • 修正一覧管理機能

  • 信憑率色分け表示

様々な画像形式に対応しており、ブラウザ、API、 スマートフォンアプリからアップロードできます。

  • 画像ファイル読込(対応画像形式:png,jpg,pdf,tiff,bmp,gif)

  • 画像アップロードAPI(オプション)

  • スマートフォンアプリ、タブレット(iOS版)

カメラで撮影された画像も、台形補正・歪み補正、ノイズ処理機能により文字認識が可能になります。

  • 向き判定

  • 台形補正

  • ゆがみ補正

  • 影・ノイズ処理

  • 印影除去(カラー除去)

Deep Learning 技術により、これまで不可能だった正確な文字列領域の認識が可能となりました。また、自然言語処理も含めた文字列単位での文字認識が可能になったため、1文字単位での文字認識に比べ文字認識率が格段に向上しました。

  • 文字列エリア自動認識

  • 文字列・文字認識

  • 自然言語処理補正

  • 信憑率出力

枠線・表認識機能により、文字列を構造的に認識して、データ化が容易になります。

  • 枠線・表認識

  • かすれ線修正認識

  • 仮想線認識 (開発中)

様々なフォーマットの帳票を位置定義をすることなしに、汎用的にデータ抽出が可能です。

  • キー・バリューデータ抽出

  • キーがない場合でのバリュー抽出

  • 表データ抽出

  • 正規表現抽出

OCR結果の文字列を形態素解析、座標解析、枠組み・表解析、空白解析等により、構造化ドキュメントを作成します。

  • 組み・表解析

  • 形態素・文字種解析

  • 位置座標解析

  • 空白解析

  • 段落解析

ユーザ管理機能により、複数のユーザにて利用可能です。

  • ユーザ追加・削除

  • 権限管理

  • パスワード再設定

  • ユーザ履歴閲覧

複数のユーザで利用できるように、処理ステータスが確認できます。

  • OCRステータス管理 ( OCR待ち、OCR中、OCR完了、変換済 )

  • 作業ステータス管理 ( 未確認、確認済、出力済 )

マスターデータとOCRを連携されることにより、入力の手間を省いたり、正確な値を自動的に入力することが可能となります。

  • OCRマスター連携

  • マスターデータ登録・編集・削除

  • マスターデータインポート(CSV)

継続的な機械学習により、文字列領域認識、文字・文字列認識の精度を向上させることが可能です。

  • 自然言語学習

  • 文字列領域認識学習

  • 文字列画像認識学習

  • 辞書登録

  • 辞書インポート

スマートOCRの導入をご検討の方、
お気軽にお問い合わせください。
「よくあるご質問」もご利用ください。
AI-OCR「スマートOCR」の導入をご検討の方、お気軽にお問い合わせください
AI-OCR「スマートOCR(smartOCR)」 注)Webページに掲載のシステム画面は開発途中のものを使用しております。ご了承ください。
「スマートOCR」は、株式会社インフォディオ の登録商標です