AI-OCR「スマートOCR」
よくあるご質問 お問い合わせでいただいたよくあるご質問をQ&A形式でまとめました。
ご利用ください。

環境について
Q-01
提供形態を教えてください。
A-01
三つの提供形態があり、
■お客様専用に学習を行った専用システム
  • オンプレミス
  • プライベートクラウド
■使用用途を制限した汎用サービス
  • クラウド
がございます。
Q-02
オンプレミスとプライベートクラウドの違いを教えてください。
A-02
オンプレミスは、個人情報のお取り扱いがあるなど、セキュリティが厳しいお客様に向いております。
プライベートクライドは、繁忙期にのみ使用するなど、使用量にばらつきがあるお客様に向いております。サーバーを複数使用することにより処理の高速化を図れます。
Q-03
プライベートクラウドとクラウドの違いを教えてください。
A-03
お客様専用の学習をしているシステムがプライベートクラウドです。
クラウドは汎用的な学習のみ行っており、サービスとしてご利用いただく形になります。
Q-04
ハードのスペックを教えてください。
A-04
OS:Linux
サーバー:GPUを使用
DB:PostgreSQL
ウェブアプリケーション:NodeJS
Q-05
ハードの用意はどのようになりますか?
A-05
お客様にご用意いただく形になります。
Q-06
使用サーバはWindowsでしょうか?
A-06
Linuxでのみ動作します。また、GPUを使用します。
Q-07
オンプレミスのサーバーの値段はどの程度の物を用意すればいいでしょうか?
A-07
弊社は50万ほどですが安価な方ですので、100万くらいであればよいと思います。
Q-08
クラウドの要望は応えていただけますか?
A-08
可能です。
Q-09
AWSでは動作しますか?
A-09
動作します。
Q-10
GPUサーバーの納品はGCPのプライベートクラウドでも可能ですか?
A-10
可能です。
Q-11
仮想サーバーは使えますか?
A-11
GPUが載せられないかもしれません。また、処理速度が落ちる可能性が高いです。
Q-12
エンジンのみの提供はしてもらえますか?
A-12
可能です。
Q-13
OCRの結果はどこに保存されますか?
A-13
サーバーに結果を保存しており、webブラウザで閲覧する形になります。
学習について
Q-01
辞書登録はどんな時に使われますか?
A-01
変換結果に誤認識があり、辞書に登録されているものだった場合に登録した文字に置換します。
Q-02
登録した辞書は製品に使用するのみでしょうか?
A-02
製品にのみ使用します。
Q-03
文字認識の学習はいつ行っているのでしょうか?
A-03
弊社が定期的に学習をし、アップデートしていきます。
お客様がご利用中に裏で学習を行うということはありません。
Q-04
製品導入後の学習は誰が行いますか?自動的に賢くなるのでしょうか?
A-04
単語の学習はご利用者様に行っていただけますが、文字認識の学習は弊社が定期的に行います。
Q-05
AIが自分で文字データを作って学習していくのでしょうか?
A-05
学習は弊社が行います。
GANで文字データを作成し、学習に利用するようなことはあります。
Q-06
学習の頻度はどのくらいでしょうか?
A-06
具体的な頻度は非公開です。
Q-07
AIへの教育(ラーニング)には何を使用するのでしょうか?
A-07
ご利用者様からエラーデータなどを頂いて教育を行います。
Q-08
過学習への対策はどうしていますか?
A-08
文字認識の学習は弊社が行い、高精度の認識ができるように調整しています。
Q-09
学習にかかる期間はどの程度でしょうか?
A-09
一ヵ月ほどです(1回1週間を数回)。
Q-10
罫線の登録の必要はありますか?
A-10
ありません。
Q-11
学習データはどこに蓄積されますか?
A-11
専用システム(オンプレミス、プライベートクラウド)はお客様側に、 汎用サービス(クラウド)は弊社側にて蓄積いたします。
Q-12
文字認識の学習を行うには弊社の枚数では足りないと思うのですが…
A-12
文字認識の学習は弊社で行いますのでご安心ください。
(過学習を防ぐためです)
Q-13
文字認識の学習の結果を見ることはできますか?
A-13
学習に関して見える化の仕組みはありません。
データ抽出について
Q-01
データの抽出はどうやって行うのでしょうか?
A-01
帳票を全スキャンし、キーを見つけてバリューを取り出します。
抽出設定により様々なデータの抽出が可能で、帳票にキーがないものを取り出すことも可能です。
Q-02
帳票中に多数あるもの(日付、金額等)の意味づけはどうするのでしょうか?
A-02
データの抽出設定を行うことにより、出力したいデータの抽出が可能です。
Q-03
データの抽出設定を行わずにマスターデータを活用することは可能でしょうか?
A-03
専用システムを導入なさるお客様で、ご希望があれば可能です。
Q-04
OCR変換にマスターデータを活用するとどう変化しますか?
A-04
帳票の解析中に、辞書に該当の単語があれば読み取り結果に反映されます。
Q-05
OCR変換後のデータは住所などの情報は持っていますか?
A-05
形態素辞書で持っています。
Q-06
出力するデータの形式を教えてください。
A-06
CSV形式です。
導入前について
Q-01:POC(実証実験)
POC(実証実験)の期間はどの程度でしょうか?
A-01
POC(実証実験)の内容によって異なります。お客様のご予算に応じた内容でも行えます。
Q-02:POC(実証実験)
実証実験の際に辞書登録を行うも導入に至らなかった場合、データが無駄になってしまいますか?
A-02
無駄になってしまう可能性が高いです。
Q-03:コンサルティング
コンサルティングは必要でしょうか?
A-03
御社のシステムにスマートOCRの導入を行うため必要です。
Q-04:サンプル検証
サンプル検証に進んだ場合、どの程度の時間がかかりますか?
A-04
最低でも2~3ヵ月ほどお時間いただいています。
Q-05:サンプル検証
サンプル検証とはどういった検証でしょうか?
A-05
お客様から実際使われている帳票を数枚程度お預かりし、検証結果のご報告を行います。 検証にて弊社がご報告する内容といたしましては
  • 文字の認識結果
  • 認識ができなかった部分についての改善可能性について
となります。
Q-06:サンプル検証
サンプル検証は何枚程度で行っていますか?
A-06
10枚以内でおこなっております。 類似した形式があれば検証を省略することがございます。
Q-07:サンプル検証
特定のデータ抽出をサンプル検証でしてもらうことはできますか?
A-07
できません。
あくまでエンジンによる文字認識の精度のみのご確認となります。
認識について
Q-01
文字の泣き別れ(分離)についてはどう対処していますか?
A-01
AIに学習させています。またロジックで確認もできます。
Q-02
文字の認識率はどのくらいでしょうか?
A-02
読み取る画像の品質によっても大きく左右されるため数字でのお答えが難しいです。 テストデータ(活字の請求書)の認識率は99.8%です。
Q-03
一文字を二文字に認識してしまう場合(「ル」を「ノ」「レ」など)はどうすればいいでしょうか?
A-03
ご利用者様に辞書登録をしていただきます。
文字の認識精度向上のための学習は弊社が行います。
Q-04
認識率の閾値はどのように設定していますか?
A-04
ユーザーに設定を合わせています。
Q-05
文字認識は文脈を読んで行うのでしょうか?
A-05
文脈を読むために形態素解析を行っています。
お客様に合わせて文脈を学習させることも可能です。
Q-06
文字認識の際に文字の種類(ひらがな、アルファベット等)の指定をせずに認識ができますか?
A-06
可能です。
Q-07
文字かぶり、角印は認識できますか?
A-07
基本的には難しいです。
データとして必要がない場合はデータ抽出を行わなければ問題はありません。
Q-08
罫線のゆがみは対応していますか?
A-08
対応しています。その他にも帳票自体の傾きやゆがみの補正も可能です。
Q-09
罫線の登録の必要はありますか?
A-09
必要ありません。
Q-10
汎用的な単語が組み合わさった固有名詞は分割されて認識するのでしょうか?
A-10
横並びの文字が分割して認識されることはありません。
Q-11
色の認識はできますか?
A-11
できません。カスタマイズで可能です。
費用について
Q-01
運用費用で年24万枚で240万円とあるが枚数はどうやって把握するのか?
A-01
年に一度の保守の際に確認します。
Q-02
価格表はありますか?
A-02
要件によって変動がありますので、詳細な価格表はございません。 基本的な目安でしたらご用意が可能です。
Q-03
価格の目安を教えてください。
A-03
あくまで概算ではありますが、
年間ライセンスはー
  • オンプレミス:120万円(~12万枚)から
  • プライベートクラウド:120万円(~12万枚)から
月額費用はー
  • クラウド:3万円(~300枚)から
程度になります。
その他初期費用等が発生します
読み取りについて
Q-01:変換
複数枚ページのPDFの変換は可能でしょうか?
A-01
可能です。 ページごとに1枚ずつのファイルに分かれている場合、同じ請求書としてアップロードすることも可能です。
Q-02:変換
OCR変換はどの程度の時間がかかりますか?
A-02
7~800字で10~20秒かかります(GPUの性能によって変動)。
Q-03:帳票画像
読み取りができる画像の形式を教えてください。
A-03
JPGやPNG、TIFなどの汎用的な画像や、イメージデータが含まれるPDFであれば読み取りが可能です。
Q-04:帳票画像
テキストPDFは読み取れますか?
A-04
イメージPDFのみ読み取れます。テキストの抜き出しはできません。
Q-05:帳票画像
マルチTIFFやPDFなど、複数枚つづりの帳票を読み取ることはできますか?
A-05
可能です。複数枚つづりの請求書がページごとに違うフォーマットになっている場合はカスタマイズが発生します。
Q-06:帳票画像
帳票画像読み取りの推奨条件はありますか?
A-06
300dpiを推奨しています。カラー可です。
Q-07:帳票画像
300dpi推奨なのは解像度が低いと認識が落ちるからか?
A-07
dpiに関係なく、1文字が32×32ドット~84×84ドットくらいのドット数を推奨しています。
Q-08:帳票画像
解像度がバラバラの帳票画像をアップロードすることは可能でしょうか?
A-08
1文字が上記ドット数になるように揃えていただければ可能です。
Q-09:帳票画像
帳票の読み取りに際して、特定のハード(スキャナー等)を購入する必要はありますか?
A-09
ありません。汎用的な画像データやイメージPDFであれば変換が可能です。
Q-10:帳票画像
帳票をカメラで撮影した画像で変換することはできますか?
A-10
可能です。 スマートフォンやタブレットのカメラで撮影していただき、アップロードしていただくことも可能です。
また、アップロード用のカメラアプリもご用意しています。
Q-11:帳票画像
風景を撮影した写真の中の文字を切り出すこともできますか?
A-11
帳票の文字認識に特化していますので、できません。
Q-12:帳票画像
一枚の画像の中に複数の帳票がある場合(領収書を複数枚張り付けてある場合など)、そのまま読取れますか?
A-12
スマートOCRを利用する前に帳票ごとに分割する必要があります。
Q-13:帳票画像
別種類のドキュメントを読み取りたい場合(請求書と納品書、等)はどうすればよいでしょうか?
A-13
エンジンをドキュメントの種類ごとに分ける必要があります。
Q-14:フォーマット
帳票のフォーマットがバラバラなのですが読み取ることはできますか?
A-14
スマートOCRは非定型帳票の読み取りに特化しているため、可能です。
Q-15:フォーマット
Word等で書かれた契約書を読み取ることはできますか?
A-15
帳票の読み取りを目的としていますので、標準機能では難しいです。
Q-16:フォーマット
罫線がない帳票で項目を正しく認識できますか?
A-16
空白の認識も可能ですので、項目ごとの認識が可能です。
Q-17:フォーマット
枠がない帳票は読み取れますか?
A-17
可能です。空白を読み取ることができます。
ただしスプレットシートに出力する際に調整が必要になります。
Q-18:フォーマット
定型は読み取れますか?
A-18
可能です。定型と非定型の区別がありません。
Q-19:フォーマット
請求項目が複数ページにまたがっているのですが、読み取りは可能でしょうか?
A-19
可能です。スマートOCRは非定型帳票に対応しておりますので、読み取りに座標指定等の設定を必要としません。
Q-20:活字
書類の番号に大文字小文字等が使われていますが、読み取りは可能でしょうか?
A-20
マスターデータをご提供いただくことによりカスタマイズ可能です。
Q-21:活字
備考欄に書かれた文字(活字)を読み取ることはできますか?
A-21
可能です。文字のサイズによっては読み取れないこともあります。
Q-22:手書き
手書きの数字は読み取れますか?
A-22
手書き数字であれば学習させることは可能です。
Q-23:手書き
手書き文字の対応はしますか?
A-23
スマートOCRは手書き文字の読み取りは未対応です。
Q-24:手書き
手書きに対応する予定はありますか?
A-24
現在は活字帳票の読み取りに注力しているため、当面は活字のみの対応になります。
Q-25:サイズ
読み取れる文字の大きさは?
A-25
300dpiで8pt以上です。
Q-26:フォント
特定のソフトのフォントを使っているが、読み取ることはできるか?
A-26
可能です。特殊なフォントを学習させることも可能です。
Q-27:英語
英語の読み取りは可能でしょうか?
A-27
アルファベットの認識自体は可能ですが、英語の読み取りに対応したOCRにするにはカスタマイズが必要です。
確認作業について
Q-01
変換後の確認作業は必要でしょうか?
A-01
必要です。
100%の認識が難しいため、確認して訂正していただく必要があります。
検証作業がやりやすいようなUIをご用意しています。
Q-02
変換後データの確認作業はどのデータで行えますか?
A-02
変換した全データと抽出したデータにて確認を行えます。
機能について
Q-01
一枚ずつしか変換できないのでしょうか?
A-01
複数も可能です。データを抽出する単位で変換していただけます。
Q-02
大量の画像を一括変換できますか?
A-02
できます。複数画像を同時にアップロードした場合、同じ帳票として扱うか別の帳票として扱うか選択できます。
Q-03
ノイズ処理後の画像データのアウトプットは可能でしょうか?
A-03
ご要望いただければカスタマイズいたします。
Q-04
アップロードされた帳票の判定はできますか?
(読み取りたいものとは別の帳票が送信されたとき)
A-04
レイアウトを判別する機能はございませんが、帳票のタイトルにて判別することは可能です。
Q-05
WebAPIに画像をpostして自動で変換することはできますか?
A-05
カスタマイズで可能です。
Q-06
電子保存法のためのタイムスタンプを付与することは可能でしょうか?
A-06
XMLでデータ自体は持っているのでカスタマイズで可能です。
Q-07
スマートフォンやタブレットからの画像のアップロードはできますか?
A-07
アップロード用のアプリをご用意しています。
Q-08
画像のアップロードやデータの書き出し機能をスマートOCRシステムから変更することは可能でしょうか?
A-08
カスタマイズ対応にて可能です。
Q-09
帳票の原本や写しを抽出したデータと紐づけることはできますか?
A-09
可能です。
Q-10
スマートOCRシステムの画面をカスタマイズすることは可能でしょうか?
A-10
可能です。
Q-11
誤認識の辞書登録は行えますか?
A-11
行えます。辞書登録を行うと、再び同じ誤認識をした場合に自動的に置換してデータ化されます。
Q-12
帳票画像を手動でアップロードするのではなく、画像を置いておく特定のフォルダを監視し、OCRシステムのファイルリストに反映することはできますか?
A-12
標準ではありませんが、カスタマイズ対応にて可能です。
Q-13
読み取ったデータを基幹システムに連携したいのですが、可能でしょうか?
A-13
カスタマイズ対応にて可能です。連携したいデータの抽出設定することができます。
その他
Q-01
エンジンはインフォディオが製造したのでしょうか?
A-01
100%弊社が製造いたしました。
Q-02
エンジン開発はどの程度の期間行っていますか?
A-02
二年ほどです。
Q-03
AI-OCRとしての個性は?
A-03
AI-OCRは切り出しやノイズ処理などの文字認識に使用しています。
非定型レイアウト・構造化処理はロジックの部分が大きいです。
Q-04
引き合いの種類はどんなものがありますか?
A-04
金融機関、メーカー、商社、コンサル、商船などです。
Q-05
販売についてはどのような形態がありますか?
A-05
直接の販売も可能ですし、代理店販売という形式をとることも想定しています。
スマートOCRの導入をご検討の方、
お気軽にお問い合わせください。
スマートOCRの導入をご検討の方、お気軽にお問い合わせください
AI-OCR「スマートOCR(smartOCR)」 注)Webページに掲載のシステム画面は開発途中のものを使用しております。ご了承ください。
「スマートOCR」は、株式会社インフォディオ の登録商標です