スマートOCRと他社AI-OCR製品の違い (明細の表データ読み取り編)

AI-OCRで注文書等の明細表データを読み取りたいとのニーズはよくあります。

FAXの注文書や、メールでPDFの注文書を受領する運用が、まだ残っている企業も多いためです。

AI-OCRで注文書を読み取った場合、読み取ったデータはその後、基幹システム等で取り込むことが一般的な利用方法となることでしょう。

そのため、後続のシステムで取り込みやすい形式のデータフォーマットでAI-OCRから出力できることが望まれます。

多くはCSV形式で出力したものをインポートする運用となりますが、AI-OCR側のエクスポート機能としてCSVファイルの列項目の選択や並び順変更さえできれば大丈夫と思っていたら、思わぬ落とし穴に遭遇することがありますので、AI-OCRを選定する際に確認しておきたいポイントととしていくつかの例をご紹介いたします。

明細表の一つのセル内に複数項目がある

明細表は読み取りやすいレイアウトもあれば、読み取りが難しいレイアウトもあります。

①読み取りが容易なよくあるレイアウト例

AI-OCRで読み取りが簡単な表レイアウト
一つの商品で1行となっており、項目ごとに列で区切られるパターンです。AI-OCRで読み取るデータもCSVで出力するデータも似たような形となるため、扱いやすいといえます。

②一つのセルに複数項目があるレイアウト例

一つのセルに複数項目があるレイアウト例
一つのセルに複数の項目が含まれているレイアウトの例です。このようなレイアウトの場合、商品セルの中にある商品名、数量、単価をそれぞれ分割してデータ抽出しなければなりません。
多くのAI-OCR製品ではこのようなレイアウトにおいて、次のような課題があります。

  • 汎用表データ読み取り機能を利用すると、一つのセルに含まれる複数項目を分割することができない。
  • 項目を分けて読み取るためには、一つ一つの項目を座標指定してテンプレートを作成するしかなく、テンプレート設定が非常に煩雑である。また座標のずれから読み取り精度が落ちやすい。

スマートOCR(または注文書革命DX)においては、このように一つのセルに複数項目が含まれているレイアウトにおいても、項目を分けて読み取ることが可能です。前述の①の例でも、②の例でもどちらも同じフォーマットでCSVデータを出力することが可能です。

商品名, 数量, 単価, 金額
goods-A,2, 2000, 4000
goods-B,1, 3000, 3000

注文書や請求書においては取引相手先が使用するフォーマットを読み取ることも多く、実際の運用においてはフォーマットを統一することができないこともよくあります。そのため、あらゆるフォーマットでも対応できるAI-OCRを選ぶということが重要になってきます。

明細表が複数ページに分かれ、2ページ目以降の明細表の大きさが異なるレイアウト例

1回の取引において明細表の行数が多い場合に、明細表がページをまたぐケースがあります。
明細表がページをまたぐ場合に、2ページ目以降も全く同じ書式であればよいのですが、2ページ目以降の書式が異なることも多いことでしょう。

多くのAI-OCRでは、このような書式の場合、1ページ目と2ページ目以降でAI-OCRのテンプレートを分けて運用しなければなりません。
テンプレートを分けて運用するということは、ファイルが複数ページで一つのファイルとしてPDF化されている場合、ページごとにファイルを分割してOCR処理をかける等の工夫が必要となります。
そのため、作業の手数が増えて煩雑になることは避けられません。

スマートOCR(または注文書革命DX)においては、ページをまたぐ明細表においても一つのテンプレートで読み取りが可能です。もちろん、複数ページにまたがる明細表を一つの表としてデCSVデータ出力することも可能です。

明細表の読み取り可否はAI-OCRを選定する際に要確認!

これらのケースでは、RPAやETL等のツールを活用し、データを加工することで解決することができる場合もありますが、とても複雑な仕組みになりがちであり、仕組みを構築するハードルも高く、保守性や運用時の読み取り安定性を考慮しても、シンプルにAI-OCR側の機能で完結できるほうが望ましいことは間違いありません。
AI-OCRを選定する際には、自社でで受領する注文書におけるすべてのフォーマットを洗い出し、OCR抽出後のデータが扱いやすいかどうかまで確認することをお勧めいたします。

The following two tabs change content below.
スマートOCRに関する情報を発信していきます。 スマートOCRは非定型帳票や手書き文字にも対応した次世代型のAI-OCRです。スマートOCRについての詳しい情報はこちらから。 公式Twitterで最新情報を配信していますので、フォローしていただけると最新情報をすぐに入手できます。