OCRとは?基礎知識と業務効率化が可能な理由

スキャナーで書類を読み取ってテキストデータに変換するOCR

OCRと聞くと、一昔前のイメージで「紙の文書をスキャナーで読み取り、文字をデータ化してくれる便利なツール」という程度にしか認識していない人が多いかもしれません。
しかし、最新のOCRは、技術革新によって大きな変貌を遂げました。AI(人工知能)との組み合わせによる文字認識率の飛躍的な向上で、これまで想像できなかったような書類の読み取りからデータの後処理まで、ビジネスに活用できる幅が広がっています。ただ、残念ながら一昔前のOCRへのイメージから抜けだせずに、自社の業務を効率化するチャンスを見逃している企業もあります。

ここでは、専門家ではない人でもOCRを理解する手助けとなるように、OCRの基礎知識やOCR導入のメリットについてわかりやすく解説します。

目次

初心者でもわかる!OCRを理解するための基礎知識

OCRとはいったい、何を指す言葉なのでしょうか。なんとなく「文字をデジタルデータ化するもの」という理解はしていても、実際に利用している人でなければ、詳しく知らないかもしれません。
まずは、OCRの言葉の意味や技術進化についての基礎知識をご紹介しましょう。

OCRは何の略語?

OCRという言葉は、英語の「Optical Character Recognition」の頭文字からとった略語で、日本語では「光学文字認識」と訳されるのが一般的です。英語では「Optical Character Reader」と呼ぶこともあります。

OCRの仕組みと利便性

従来、帳票や本などに印刷された文字をデジタルデータ化するためには、人間の目で見て、脳でその文字が何であるかを判断し、それをコンピューターに手作業で入力する必要がありました。数行の文章であればともかく、書類が大量にあると、その労力はかなりのものです。
そこで、複合機やスキャニング専用機器などで文書を画像として読み取り、自動的にその画像から文字を抜き出し、コンピューターで使えるデータとして認識させる技術が開発されました。これがOCRです。

■OCRは紙書類の文字をテキストデータに変換する技術
OCRは紙書類の文字をテキストデータに変換する技術

ビジネスでOCRが注目される理由

帳票や文書を文字データに自動変換して保存できるようになれば、人間がパソコンに入力する手間や時間などのコストが削減できます。それだけでなく、その後の情報管理の手軽さや情報の有効活用へとつながります。データを一元管理して、パソコンで情報を簡単に検索したり、ほかの書類にデータを流用したりすることも可能です。
つまり、OCRを利用すると、業務上さまざまなメリットが生まれる可能性があるため、大量の紙書類を扱うビジネスシーンで注目されています。

■OCRの活用により、さまざまな帳票類や文書を効率的にデータ化することが可能に
OCRの活用により、さまざまな帳票類や文書を効率的にデータ化することが可能に

日本のOCRの技術進化とブレイクスルー

文字認識技術の開発は、世界では1900年代に始まったといわれています。それでは、日本のOCRはどのように進化していったのでしょうか。少し歴史を振り返ってみましょう。

国産OCR誕生のきっかけは郵便番号

日本で国産OCRが誕生したのは1968年、郵便番号制度導入がきっかけです。郵便局内で行う業務の自動化を図るため、はがきの赤い枠内に書かれた郵便番号を読み取り、集配局ごとに仕分けるOCR機械が製品化されました。
その後、1980年代には日本におけるOCRの普及期を迎えます。処理を行うコンピューターの低価格化やOCRのソフトウェアパッケージ化が進み、個人でも利用できるレベルの各種OCRサービスが普及するまでに進化したのです。ただ、文字認識率の精度は満足のいくものではなく、読み取り後のデータを人間が目視で確認してチェック、修正する必要がありました。

日本語の文字認識の難しさ

日本におけるOCRの技術進化の歴史を見ると、2000年代になるまで存在していた壁があります。それは、日本語の難しさです。
OCRの文字認識では、あらかじめ文字判別のもとになる情報をデータベースに蓄積し、そのデータベース内にある情報と、読み取った情報をマッチングさせて何の文字かを判別するという特徴があります。
例えば、英語圏に限っていえば、アルファベットと数字を判別できれば十分なため、データベースの情報も複雑になりません。しかし、日本語の場合、ひらがな、カタカナに加え、常用漢字もあります。特に、漢字は画数が多く、似たような漢字もあります。人間が読めば文字の前後の文脈で判断できるような文章でも、OCRの読み取り精度には限界があり、文字認識精度は頭打ちになっていました。

■OCRによる日本語の文字認識の難しさの例
OCRによる日本語の文字認識の難しさの例

OCRを飛躍的に向上させたブレイクスルーとは?

そんな中、OCRにブレイクスルーをもたらすきっかけになったのが、2012年に開催されたILSVRC(コンピューターによる画像認識技術に関する研究集会)でした。
カナダのトロント大学の研究チームが、膨大な画像データの中から対象物を認識するコンテストで、2位以下に圧倒的な差をつけて優勝したのです。このとき彼らが採用していたのが、AIの深層学習(ディープラーニング)を用いた画像認識システムでした。これ以降、深層学習に注目が集まり、世界的なIT企業が研究開発を加速させるなど、AIの進化を後押しすることになりました。

このAIとOCRを組み合わせたのがAI-OCRと呼ばれるものです。深層学習では、AIが膨大な画像パターンを自動的に学習して、読み取った画像データが何であるのかを人間の脳のようにシミュレーションして判断します。
これまでのOCRではできなかった、データベースにない情報を新たに学習したり、読み取った文字をプログラムで補正したりすることで、文字認識力が格段に進歩することになりました。特に、これまで難しかった「手書き文字」の認識率も向上し、手書きの帳票や文書などを読み取ることが可能になったため、ビジネスシーンでの注目も高まったのです。さらに現在では、ただ文字をデジタルデータに変換するだけではなく、読み取った後のデータ抽出・加工といった後処理を自動で行うこともできるようになっています。

AI-OCRとは?OCRとの違いや特徴・導入メリット

企業がOCRを導入するメリットとは?

技術の発展でより実用度が増したOCRは、企業の業務効率化ツールとしても活用できるようになりましたが、どのようなシーンで恩恵を受けられるのでしょうか。
続いては、企業の業務にOCRを導入する具体的なメリットをご紹介しましょう。

データ入力業務の手間を削減できる

取引先や社員から、請求書や納品書、領収書などの帳票が紙文書で届いた場合、基本的にこれらのデータを必要なソフトウェアに手入力して管理することになります。入力作業は部署によっては膨大になり、時間と労力を割くことになります。
この入力作業はOCRで代行できますので、手間の削減につなげることが可能です。

■OCRは各種帳票を手作業でデータ入力する手間を削減する
OCRは各種帳票を手作業でデータ入力する手間を削減する

保管コストを削減できる

帳票類をはじめ、企画書や決裁書などの業務に関わる紙文書を、紙の状態のままファイリングして保管している企業もあるでしょう。この場合、書類を保存しておくスペースや書類を管理するコストが発生します。
OCRで書類をデジタルデータ化しておけば、書類キャビネットや資料室など、物理的な保管スペースを大幅に削減できます。紙の経年劣化やほかの書類に紛れて紛失するといった心配もありません。

データ検索・共有・加工がしやすい

書類をデジタルデータ化した場合、パソコンなどから気軽に検索できるため、必要な書類を探すのが楽になります。また、データを共有ストレージに保存していれば、ほかの従業員もアクセスできますから、情報共有しやすいでしょう。しかも、過去に読み取ったテキストデータを加工して流用することができ、新しい文書や資料づくりの作業効率もアップします。

OCRで紙の書類をデジタル変換する手順

OCRを使って紙の書類をデジタルデータ化する手順は、それほど複雑ではありません。続いて、一般的なOCRでの読み取り手順を見ていきましょう。

1. データ化する紙の帳票や文書を用意する

まずは、データ化したい紙の帳票や文書などを用意します。このとき、スキャニング時にノイズがのらないよう、ゴミが付着していないか確認しておくといいでしょう。
OCRには、できるだけ白に近い用紙に黒ではっきりと印刷された(または書かれた)文字が最適です。機械が読み取りやすい特殊なインクで印刷した専用のOCR用紙を使う場合もあります。AI-OCRの場合は認識技術が優れているため、通常の用紙やレシートでも読み取り可能です。

2. 紙書類をスキャンして画像データにする

紙の書類をスキャンします。スキャンの設定は、文字の認識率アップのため、基本的にモノクロで行い、読み取る用紙が斜めにならないよう、注意して行いましょう。
スキャンする機器は、複合機をはじめとするスキャナーやOCRリーダー、デジタルカメラなどがあります。裏写りしてしまうと認識率が落ちるため、読み取る書類が薄い場合には裏に黒色の紙をあてたり、裏写り防止機能を持つスキャナーを使ったりすることで裏写りを軽減できます。

3. 読み取った画像データを確認する

OCRの文字認識処理を行う前に、読み取った画像データが適切かどうかを確認し、問題があれば加工する必要があります。
例えば、斜めにスキャンしてしまっているなら、データ内の文字が水平になるように加工が必要です。また、画像が暗ければ明るさを調整したり、カラーでスキャンしてしまった画像をモノクロに変換したりするなどの加工が必要な場合もあります。文字がかすれて見えない状態であれば、再度スキャンする必要があるかもしれません。

4. 画像データのレイアウトから文字列を指定する

読み取った画像データのどこに文字列があるか、レイアウト上で指定します。そしてその文字列を、項目単位で切り出します。
帳票など、定型書類を何回も読み取る場合には、レイアウトをテンプレート登録しておくことで、毎回レイアウト指定をする手間が省けます。ただ、見積書や請求書など、会社ごとにフォーマットが違う非定型の書類は、その都度、レイアウトを指定する必要があります。
なお、AI-OCRの中には、このような人間が手間をかけて行っていたレイアウト指定作業に、自動で対応してくれるものもあります。

5. OCRで文字をデジタルデータ化する

切り出した文字列を、OCRで認識処理します。OCRでは、1文字単位で文字を切り出して認識していきますが、AI-OCRの場合は文字列での認識が可能です。
AIで学習しているデータをもとに読み取った文字を自動判別することもできますので、文字の認識率が高まります。

6. 変換データを目視チェック・修正する

最後に、OCRで読み取ったデータを目視でチェックします。形状が似ている文字の誤変換がないかをすべて確認して、誤変換があればデータを手入力で修正します。
AI-OCRは文字認識率が飛躍的に向上しており、活字は99.8%、手書きは98.0%という読み取り精度ですが、100%ではないため目視チェックは必要です。

OCRを導入する前に担当者が感じるQ&A

OCRを導入する前に担当者が感じるQ&A

一言で文字を認識してデジタルデータ化するといっても、業務で実際にOCRを使うことを考えると、気になる点が出てきます。
ここでは、OCRを導入したいと考えている企業担当者が疑問に持ちそうなことを、Q&A形式でご紹介します。

Q:OCRに対応している用紙形式や帳票の種類はありますか?

従来型のOCRの場合は、読み取りに適した用紙や定型フォーマットの使用といった制約があります。AI-OCRであれば、AIが学習をして高精度な文字認識をするため、非定型フォーマットや癖のある手書き文字の読み取りも可能です(設定が必要な場合もあり)。

Q:OCRを導入する際に必要な機器には、何がありますか?

基本的にOCRには、端末となるパソコンに加え、スキャナーまたは専用リーダーが必要です。スキャナーや専用リーダーは多数種類がありますので、業務に合わせて最適な物を選びましょう。
また、デジタルカメラやスマートフォンのカメラで撮影した画像データも使用できるため、その場合はスキャナーや専用リーダーは不要です。

Q:OCRの使用環境はどのようなものですか?

OCRのソフトウェアにもよりますが、大きく分けると、自社サーバーにインストールする「オンプレミス型」、インストールされている外部のサーバーを利用する「クラウド型」の2つがあります。

Q:OCRの対応言語はどの言語ですか?

日本のビジネス分野のOCRで対応している言語は、日本語と英語が多くなっています。技術的にほかの言語に対応できないわけではなく、日本語と英語以外のビジネス需要が少ないためです。

Q:OCRは、縦書きの文書を読み取れますか?

縦書き文書も読み取れます。ただし、日本語の縦書き認識はOCRの苦手な分野で、最新のAI-OCRでも、非定型のフォーマットや自由にレイアウトされた縦書き文書の読み取りは実用的ではありません。
これは、ビジネス分野で縦書きの書類があまり見られず、必要なAI学習を十分に行えないためです。

食品メーカーのOCR(AI-OCR)導入事例

実際に企業がOCRを導入すると、どれくらいのメリットがあるのか、気になるところです。
そこで、インフォディオの「スマートOCR」を導入いただいた企業の導入事例をご紹介します。

ある食品メーカーでは、1日に大量の発注書や注文書が届くため、人手や時間をとられていました。通常のOCRを導入しようにも、フォーマットが異なる発注書や注文書のデジタルデータ化は、スキャン後の調整作業が必要になり、手間がかかるため採用を見送るしかありません。

しかし、進化したAI-OCRであれば、非定型のフォーマット帳票を読み取ることができます。スキャンしたデータの加工も簡単で、パソコンのアプリケーションを使えば、画像データのアップロードからOCRでのデータ変換、CSVデータ出力まで、一連のプロセスを自動化可能です。
これにより、作業量と作業時間が大幅に削減でき、業務を効率化することができました。

進化するOCRを活用して、自社ビジネスの成長を!

OCRの仕組みや文字認識の方法、企業への導入メリットなどについてご紹介しました。IT技術の発展により、従来型のOCRからは想像もできなかったようなAI-OCRが登場し、ビジネスシーンで注目されています。
インフォディオでは、ビジネスシーンやご予算に応じたさまざまなAI-OCRソリューションをご提供しています。自社の業務改善をご検討されている方に、最適なAI-OCRソリューションをご提案いたしますので、お気軽にお問い合せください。

AI-OCR「スマートOCR」の特長