スマートOCRの製品特長・機能
|AI-OCR対応のスマートOCR
非定型の紙帳票(請求書・発注書等)のデータ化を実現するディープラーニング(人工知能)スマートOCRの特長とは

スマートOCR 3つの特長

文字領域抽出エンジン、文字認識エンジン

特長① 高精度な文字認識・全自動変換

■AI 文字列エリア認識エンジン

請求書、決算書、勤務管理表、健康保険証、領収書、通帳、源泉徴収票など ユーザーが制限なく作成し、帳票画像のデータ化が可能!

文字列エリア認識エンジン

■AI 文字認識エンジン

インフォディオ独自開発の文字列単位認識エンジンを用いており、高精度の認識が可能。

AI 文字認識エンジン

■AI 歪み補正エンジン

プロジェクションマッピング技術を用いた歪み・たわみ補正機能により写真で撮影した歪んだ書類、 台形の書類も整形することが可能。

AI 歪み補正エンジン

文字領域抽出エンジン、文字認識エンジン

特徴② 高度なデータ抽出方法

■高度なデータ抽出

請求書、決算書、勤務管理表、健康保険証、領収書、通帳、源泉徴収票などユーザーが制限なく作成し、帳票画像のデータ化が可能です。

文字領域抽出エンジン、文字認識エンジン

■スマートOCRポイント

フォーマットの異なる請求書 から、共通のデータ抽出テンプレートを作成し「請求日」「会社名」「請求金額」「振込口座」 等の項目を自動的にデータ抽出できます。
また、フォーマットの異なる請求書 (帳票)から、帳票内の表データ「商品名」「数量」「単価」「金額」等を自動的にデータ抽出できます。

文字領域抽出エンジン、文字認識エンジン

■高精度表認識機能

高度な表認識機能により複雑な表データや、複数行項目のデータ化が可能です。

文字領域抽出エンジン、文字認識エンジン

■インテリジェントデータ抽出機能エンジン

WEBブラウザにてデータ抽出設定が可能です。(データ抽出設定サポート・設定代行も行います)
【スマートOCRの設定項目(一例)】
①バリュータイプ、②キーバリュー (方向・距離)、③大まなか位置指定・詳細な位置指定、④正規表現、⑤フィルタ処理、⑥結合・ページ指定

文字領域抽出エンジン、文字認識エンジン

【表データ抽出設定項目(一例)】
①自動抽出、②キーワード、③複数行の指定、④正規表現、⑤抽出フィルター(数量,金額…等)、⑥エリア指定

文字領域抽出エンジン、文字認識エンジン

■AI-EX データ抽出エンジン

ユーザが抽出設定を行うことなく、AIが確定データを基に学習し高度なデータ抽出を可能とします。

文字領域抽出エンジン、文字認識エンジン

■プログラムベースデータ抽出エンジン

抽出条件が複雑な帳票においては本エンジンにてプログラムを作成しデータ抽出をすることが可能です。

文字領域抽出エンジン、文字認識エンジン

高度な管理・連携・セキュリティ

特徴③ 高度な管理・連携・セキュリティ

■文字確認・管理しやすい操作画面 (UI/UX)

文字の確認や、管理しやすい操作画面をご使用いただけます (UI/UX)。ステータスが未確認・保存済・確定済・ダウンロード済とタグで色分けされたり、また対応する文字色のついたラインがひかれるため一目で確認することができます。

UI/UX

■ユーザ・グループ管理機能

グループ内では情報の共有・分担作業ができ、複数のグループでのご利用が可能です。

ユーザ・グループ管理機能

■テンプレート自動振リ分け機能

請求書・領収書・注文書・決算書などの帳票を、ファイル名、ドキュメント内の文字列により自動でテンプレートを振り分け、適用することができます。

テンプレート自動振リ分け機能

■マスター連携機能

OCR結果に、あらかじめ登録してあるマスターデータを付加することで連携出力が可能です。会社コード、会社住所、担当者、勘定科目…等の突合作業などにかかる手間を省力化することができます。※表データもマスター連携可能です。
(例)請求書 ( 帳票 ) の「請求元」によって「会社コード」を自動的に付加させ突合作業をすることが簡単にできます。

マスター連携機能

■スマートOCR LOADER(アプリ)

スマートOCRデスクトップアプリをインストールすることでお使いいただけます。
作業の流れを自動化(自動アップロード、OCR変換、結果の自動ダウンロード)することで時間などのコストを削減することができます。

スマートOCR LOADER(アプリ)

■スマートOCR AI-DR

ユーザー特化型 画像ファイルの分類 & ディレクトリ移動アプリです。

スマートOCR AI-DR

■スマホアプリ連携

スマートOCR スマホアプリ( iOS , Android )で書類を撮影し、アップロードできます。アップロード後はブラウザ上でデータを確認することができます。

スマホ アプリ連携

■高度なデータ検索機能

過去にOCR変換・抽出したデータを「日付」「ファイル名」「請求先」等を指定して検索・確認をすることが可能です。

高度なデータ検索機能

■高セキュリティ

スマートOCRでは2段階認証、IPアドレス制限、パスワードロック・パスワード制限、オンプレミスにて高セキュリティ体制をとっているため、ご安心してご使用いただけます。

高セキュリティ

その他: スプレッドシート機能

スマートOCRで認識した文字データをすべてスプレッドシートにて表示することが可能です。

その他: スプレッドシート機能

その他: 透明テキストPDF機能

紙帳票が透明テキストPDFに変換できます。オフィスの紙帳票がデジタル化され、検索が可能となります。

その他: 透明テキストPDF機能

抽出条件の設定は、直感的な操作で簡単にできます

バリューのタイプ、バリュー近傍のキー文字列およびバリューとの位置関係、ページ内の位置等を設定することにより、キーに最も適したバリューデータを抽出します。

バリュー(値)の設定は、あらかじめ用意された9種類のタイプ(文字列、日付、金額、電話、会社名、電話番号、数字、数字&テキスト)から選択するだけで、その特性にあったデータが自動的に抽出されます。

あるキー(項目)に対するバリュー(値)の、帳票内での位置関係(上下左右)を優先付け設定する事で、より正確に抽出が可能になります。

機能一覧

WEBブラウザにより簡単に画面操作ができ、インストールしなくても利用できます。

  • 画像サムネイル表示

  • ファイルアップロード(複数可能)

  • スプレッドシート表示機能

  • 絞り込み表⽰

  • 画像の拡大、縮小表示

  • OCR認識機能

  • 誤認識文字修正

  • 修正一覧管理機能

  • 信憑率色分け表示

  • 再OCR

  • 画像切り出し

様々な画像形式に対応しており、ブラウザ、API、 スマートフォンアプリからアップロードできます。

  • 画像ファイル読込(対応画像形式:png,jpg,pdf,tiff,bmp)

  • 画像の部分切出し

  • 画像アップロードAPI(オプション)

  • スマートフォンアプリ(オプション)

  • ⾃動アップロード・ダウンロード( デスクトップアプリ・オプション)

カメラで撮影された画像も、台形補正・歪み補正、ノイズ処理機能により文字認識が可能になります。

  • 向き判定、回転処理

  • 台形補正

  • ゆがみ補正

  • 影・ノイズ処理

  • 印影除去(カラー画像)

Deep Learning 技術により、これまで不可能だった正確な文字列領域の認識が可能となりました。また、自然言語処理も含めた文字列単位での文字認識が可能になったため、1文字単位での文字認識に比べ文字認識率が格段に向上しました。

  • 文字列エリア自動認識

  • 文字列・文字認識

  • 自然言語処理補正

  • 信憑率出力

  • 手書き☑・手書き○認識

枠線・表認識機能により、文字列を構造的に認識して、データ化が容易になります。

  • 枠線・表認識

  • かすれ線修正認識

  • 仮想線認識

様々なフォーマットの帳票を位置定義をすることなしに、汎用的にデータ抽出が可能です。

  • キー・バリューデータ抽出

  • キーがない場合でのバリュー抽出

  • エリア指定抽出

  • チェックボックス抽出

  • 表データ抽出

  • 正規表現抽出

  • マスターデータ連携

  • 抽出データの加⼯、演算

  • 抽出条件テンプレートのインポート、エクスポート

  • ⾃動ダウンロード(デスクトップアプリ・オプション)

OCR結果の文字列を形態素解析、座標解析、枠組み・表解析、空白解析等により、構造化ドキュメントを作成します。

  • 組み・表解析

  • 形態素・文字種解析

  • 位置座標解析

  • 空白解析

  • 段落解析

ユーザ管理機能により、複数のユーザにて利用可能です。

  • ユーザ追加・削除

  • 権限管理

  • パスワード再設定

  • ユーザ履歴閲覧

複数のユーザで利用できるように、処理ステータスが確認できます。

  • OCRステータス管理(読込完了、OCR待ち、OCR中、OCR完了)

  • 作業ステータス管理(未確認、保存済、確定済)

  • 履歴検索、確定データ検索

マスターデータとOCRを連携されることにより、入力の手間を省いたり、正確な値を自動的に入力することが可能となります。

  • OCRマスター連携

  • マスターデータ登録・編集・削除

  • マスターデータインポート、エクスポート(CSV)

継続的な機械学習により、文字列領域認識、文字・文字列認識の精度を向上させることが可能です。

  • 自然言語学習

  • 文字列領域認識学習

  • 辞書登録

  • 辞書インポート