帳票ナビ

OCRとは?意味やメリット・事例、「AI OCR」についても解説!

業務効率化作成日:2022.09.25 更新日:2024.02.09

DXやSDGsの取り組みが活発化する昨今、紙文書の電子化・ペーパーレス化に取り組む企業が増えつつあります。
そうしたなか、注目度が増している技術が「OCR(オーシーアール)」です。

この記事では、
「OCRって何?」
「OCRを活用するとどんなメリットがあるの?」
「OCRを活用した事例はある?」
といった疑問をお持ちの方に向け、OCRの基礎から活用メリット、実際に導入した企業の事例までわかりやすく解説します。
紙文書の電子化や業務効率化に課題を感じている方は、ぜひ参考にしてみてください。

【事例】文書の電子化によりペーパーレスを実現!

・請求書の正確なデータ化により年間185時間の工数削減
・領収書や請求書などの文書を電子化し、電子帳簿保存法へ対応
文書管理ソリューション「invoiceAgent文書管理」により、ペーパーレス化・業務効率化に成功した事例をご紹介します。

OCRの基礎知識

2204_ocr_02.jpg

まずはOCRの基礎知識について、用途例も交えつつ解説していきます。

OCRとは?

OCR(オーシーアール)とは「Optical Character Recognition/Reader(オプティカル・キャラクター・レコグニション/リーダー)」の頭文字を取った言葉で、日本語では「光学的文字認識」と訳されます。
紙に印刷された文字をスキャナやカメラで読み込み、テキストデータに変換する技術です。

通常、紙の文書をスキャンしたりデジタルカメラで撮影して画像データ化しても、文書内の文字はあくまで画像の一部であり、テキストデータのように扱うことはできません。
OCR技術を用いることで、紙に印刷された文字をテキストデータとして扱えるようになり、コピー&ペーストして業務システムへと簡単に入力したり、システム上で検索したりできるようになります。

OCRの用途例

OCRの活用シーンとして、以下のような例を挙げることができます。

  • 紙の資料や書類をスキャンしてペーパーレス化を進める
  • レシートを読み取り内容をデータ化し、経費申請に利用
  • 交換した名刺をデータ化してデータベースに取り込む
  • アンケートをデータ化して自動集計する

これらはOCRの用途のごく一部であり、紙ベースの資料や情報を取り込みデータ化するさまざまな場面でOCRの技術が活用されています。

AI OCRとは?

OCRとAI技術を組み合わせたものが「AI OCR」です。海外では「ICR(Intelligent Character Recognition)」とも呼ばれます。

AI OCRは、従来のOCRよりも文字認識の精度が高いのが特徴です。
たとえば、従来のOCRではカタカナの「ロ」と漢字の「口」のように、形状が似ている文字を正確に区別するのが困難でした。AI OCRであれば、前後の文脈や蓄積された過去データを参考に、より精度の高い文字認識が可能です。

また、AI OCRは非定型フォーマットの読み込みや手書き文章の認識が可能なものもあり、OCRよりも幅広い用途で活用することができます。

OCRが注目されている背景

2204_ocr_03.jpg

OCRが注目されている主な背景は次の4つです。

  • 生産性向上の必要性が増している
  • RPAツールの普及
  • AI技術の発展
  • 電子帳簿保存法の改正

それでは、OCRの注目度が増している背景について詳しく確認していきましょう。

生産性向上の必要性

少子高齢化が進む日本は今後、長期の人口減少過程に入ると予測されています。

国立社会保障・人口問題研究所が公表した「日本の将来推計人口(平成29年推計)」によれば、2015年時点で7,728万人だった生産年齢人口は、2040年には6,000万人を割り、2065年には4,529万人まで減少すると推測しています。
(参考:日本の将来推計人口(平成29年推計)|国立社会保障・人口問題研究所

人手不足が加速するなかで生産力を維持・向上していくためには、作業を効率化して生産性を高めていくことが不可欠になります。

たとえば、紙書類を目視で確認して業務システムに入力していく作業は、OCRを活用することで大幅に効率化することが可能です。OCRによって削減された工数をコア業務に充てることで、生産性を高めていくことができるでしょう。

RPAツールの普及

OCRが注目を集める背景として、RPAツールの普及も見逃せません。

RPAとは「Robotic Process Automation(ロボティック・プロセス・オートメーション)」の略で、定型作業を自動化するためのツールのこと。
先述した生産性を高めていくためには、人が行う必要がない定型作業を自動化していく取り組みも必要になります。

OCRとRPAを組み合わせることで、紙文書をOCRでテキストデータ化し、業務システムへの入力作業や集計作業をRPAで自動化する、といったことが可能になります。

AI技術の発展

OCRの実用性を飛躍的に高めた要因として、AI技術の発展も挙げられます。

OCRとAIを組み合わせたAI OCRが登場したことで、非定型文書の読み込みが可能になったほか、ディープラーニングによる機械学習で高精度な文字認識が可能になりました。
また、従来のOCRでは困難だった手書き文章の読み取り精度が向上し、さまざまな用途での活用が可能になっています。

電子帳簿保存法への対応

電子帳簿保存法の存在もまた、OCR技術に注目度が高まっている要因のひとつです。

2022年1月に施行された電帳法改正により要件が大幅緩和され、今まで以上に国税関係帳簿書類の電子化に着手しやすくなりました。
一方で、電帳法の要件を満たすために、企業側が対応しなければならないハードルがあるのも事実です。
そのハードルのひとつが「検索機能の確保」です。

電帳法の保存区分のひとつ「スキャナ保存」では、以下を満たす検索機能を確保しなければなりません。

  • 取引等の年月日、取引金額、取引先での検索
  • 日付、金額の記録項目は、その範囲を指定した検索かつ二以上の任意の記録項目を組み合わせての検索、または電磁的記録のダウンロードの求めに応じる

OCRやAI OCRを活用することで文書内の情報を検索用のデータとして扱うことが可能になるため、電帳法の検索機能要件への対応という面でOCRの注目度が高まっているのです。

OCRの基本的な仕組み

2204_ocr_04.jpg

次は、OCRの基本的な仕組みとして、以下の5ステップを確認していきましょう。

  1. ブロック(文字領域)を解析
  2. ブロック内の行・文字を解析
  3. 解析した文字の認識
  4. 文字の訂正
  5. テキストデータ化

1.ブロック(文字領域)を解析

まずはブロック(文字領域)を判断・解析します。
画像内のどの領域に文字があるのかを解析し、ブロックを設定します。読み取り範囲を手動で設定することも可能ですが、近年の高精度なOCRでは、自動でブロックを検出できるケースが増えています。

2.ブロック内の行・文字を解析

ブロック内の文字列を解析し、どこまでが一行なのか、そして何行で構成されているのかを検出します。
さらに、検出した各行のなかで文字の切れ目を解析し、1文字ずつ切り取っていきます。

3.解析した文字の認識

次は、切り取られた文字が「どの文字なのか」を認識するステップです。
文字のサイズを一定に揃える「正規化」や、文字が持つ特徴を抽出する「特徴抽出」、抽出した特徴をデータベースと照合する「マッチング」などの処理を経て、文字候補を特定します。

4.文字の訂正

特定した文字候補が適切かどうかを判断し、必要に応じて訂正を行います。
この際、辞書データの単語情報と照合したり、AIで前後の文脈から整合性を判断したりして、文字を最終的に決定します。

5.データ化・テキスト化

上記のステップを経て認識した文字を、テキストデータとして出力します。
使用するツールによっては、PDFファイルやWordファイルなど、元の書類レイアウトを再現したフォーマットで出力することも可能です。

OCRを活用するメリット

2204_ocr_05.jpg

OCRを活用する主なメリットとして、以下の4点を挙げることができます。

OCRを活用するメリット
  • ペーパーレス化の促進
  • 業務効率の改善
  • 情報の検索性向上
  • データ活用の促進

次は、OCR活用によって得られるメリットについて詳しく確認していきましょう。

ペーパーレス化の促進

ビジネスシーンでは、日々数多くの文書がやり取りされています。
たとえば、契約書や請求書といった企業間取引文書、申請書や稟議書といった社内文書などです。
これらの文書には保存期間が定められているものも多く、紙ベースで運用していると累積的に増え続けてしまいます。

OCRを活用して紙の文書を電子化することでペーパーレス化が進み、保管スペースにかかっていたコストを削減できるでしょう。また、後述する業務効率改善や検索性向上の効果により、人的コストの削減にもつなげることが可能です。

業務効率の改善

OCRを活用することで、紙書類を目視で確認する負担が軽減されます。
とくにAI OCRであれば、高精度で文字を認識することができるため入力業務の正確性を高めることができます。
さらに、RPAツールと連携することで、業務システムへの入力作業や集計作業も自動化することが可能です。

このようにOCRで定型作業を効率化することで、より生産性の高い業務に注力できるでしょう。

情報の検索性向上

紙の情報がテキストデータ化することで、検索性が大幅に向上します。

紙ベースで書類を管理している場合、過去の文書を参照する際に、大量の書類のなかから該当の文書を探し出す必要があります。
一方、OCRで紙文書をデータ化していれば、さまざまな条件の掛け合わせで検索を行うことができ、必要な情報を速やかに参照することができるでしょう。

先述した電子帳簿保存法の検索要件の確保という面でも、大いに役立てることが可能です。

データ活用の促進

OCRを利用する大きなメリットとして、データ活用の促進も挙げられます。

保管しているだけだった紙の文書を電子化することで「情報資産」へと生まれ変わります。
紙の情報をデータ化することで分析の幅が広がり、これまで見えなかった課題やヒントを見つけることができるかもしれません。

また、郵送やFAXの手間なく、インターネットを介して即座に情報共有を行えるようになるため、組織全体でのデータ活用を促進することができるでしょう。

自治体で進むOCRの活用

企業だけでなく自治体においてもOCR技術の導入が進みつつあります。

総務省が令和4年(2022年)に公表している資料によれば、地方自治体におけるAIの機能別導入状況では、「音声認識」が431件で最多となっており、AI OCRが該当する「文字認識」はほぼ同数の429件でした。
(参照:自治体におけるAI・RPA活用促進|総務省

また、この調査では地方自治体におけるAI OCRの導入効果として以下のような事例が報告されています。

自治体でのAI-OCR導入効果の例
  • 紙の帳票からのデータ入力作業で、年間1,252時間の削減効果
  • RPAとの組み合わせにより、年間4,435時間の削減効果の見込み
  • 紙資料の読み取りにAI-OCRを活用し、税務課の銀行口座の入力作業を年間100時間削減し、還付作業における振込を早期化

紙文書のデータ化なら「invoiceAgent」

紙文書をデータ化を検討しているのであれば、ウイングアーク1stが提供する文書活用ソリューション「invoiceAgent(インボイスエージェント)」の導入を検討してみてはいかがでしょうか。
中でも「invoiceAgent AI OCR」は、高精度AI OCRで紙文書をデータ化し、業務の効率化やデータ活用の促進を実現します。

次は、「invoiceAgent AI OCR」の特徴をご紹介します。

高精度なAI OCRで文書をデータ化

「invoiceAgent AI OCR」は後述する5つのOCR/AI OCRエンジンを搭載しており、読み取りを行う文書に応じて最適なOCR/AI OCRエンジンを選択することができます。
同一文書内のフィールド単位でOCR/AI OCRエンジンを切り替えたり、1つの読み取り項目に対して複数のOCR/AI OCRを設定して結果を比較したりすることも可能です。

また、レイアウトが異なる文書を一括スキャンしても、自動識別機能によって関連性のある文書をセットとして認識してデータ化することができます。自動補正機能も搭載されているため、スキャンやカメラ撮影によって傾いてしまった文書でもOCR認識率の低下を防ぎます。

これらの充実したOCR機能により高精度なテキストデータ化が可能で、目視による確認や手作業による修正を最小限に抑えた運用を実現します。
※2022年6月より「SPA/SPA Cloud」は「invoiceAgent 文書管理」「invoiceAgent AI OCR」に名称を変更しました。

システム連携で業務効率化とデータ活用を促進

invoiceAgent AI OCRで読み取った文書データをRPAツールと連携することで、業務システムへの入力を自動化することができます。
また、WebAPIや各種連携アダプターを用いてクラウドサービスなどの外部システムとの連携も可能です。
さらに、ウイングアーク1stが提供するソリューションを組み合わせることで、さらなる業務効率化とデータ活用を促進することができます。

たとえば、企業間取引文書のWeb配信・返信を実現する「invoiceAgent 電子取引」、契約業務の電子化を叶える「invoiceAgent 電子契約」などの帳票ソリューションとの組み合わせで、文書の電子化・配信・管理を一貫して行うことが可能になります。

また、「MotionBoard」などのデータ活用ソリューションと組み合わせれば、蓄積した紙文書の情報を可視化したり高度な分析に役立てることができるでしょう。

「invoiceAgent」の導入・活用事例

次は、「invoiceAgent」を実際に導入・活用した事例をご紹介します。

支払業務の自動化(武蔵コーポレーション)

「invoiceAgent」を活用して支払業務の自動化を実現した事例です。

不動産業を営む武蔵コーポレーション株式会社では、毎月200枚以上のAD請求書の目視チェックとデータ入力処理を丸一日かけて行っており、担当者の負担が大きい状況でした。

「invoiceAgent」導入後、QRコードを印字した請求書にOCR処理を行い、支払情報のデータ化を実現。データ化した情報はCSVで出力可能で、丸一日かかっていた請求と支払情報のチェックおよび入力作業が1時間に短縮されています。

▼事例詳細はこちら
武蔵コーポレーション株式会社のinvoiceAgent導入事例をもっと見る

伝票入力の工数削減(GSIクレオス)

case_creos.png

繊維および工業製品の専門商社である株式会社GSIクレオスは、社内業務のデジタル化を目的に「invoiceAgent」を導入しています。

取引先から受領する紙の仕入伝票を「invoiceAgent」のOCR/AI OCR機能でデータ化し、自動で基幹システムに取り込む仕組みを構築。入力業務の大幅な工数削減を実現しています。

「invoiceAgent」は適材適所でOCR/AI OCRを使い分けることができるため、トータルコストを抑えつつ導入・運用できるという点を評価しています。

▼事例詳細はこちら
株式会社GSIクレオスのinvoiceAgent導入事例をもっと見る

帳票のインプットを効率化(SBIいきいき少額短期保険)

死亡保険や医療保険、ペット保険などを提供するSBIいきいき少額短期保険株式会社は、帳票運用におけるインプット部分を効率化するため「invoiceAgent」を導入しました。

顧客から返送される手書きの帳票を「invoiceAgent」のOCR/AI OCR機能でデータ化し、あらかじめ設定してあるキー項目に該当するデータをSalesforceに自動入力する仕組みを構築。

目視と手作業でデータ入力を行っていた担当者の負荷を大幅に軽減することに成功しています。

▼事例詳細はこちら
SBIいきいき少額短期保険株式会社のinvoiceAgent導入事例をもっと見る

受領する月報兼請求書をデータ化(ロジクエスト)

【ロゴ変更】case_logiquest.png

物流事業を展開する株式会社ロジクエストは、「invoiceAgent」の活用により全国の契約ドライバーや協力会社から受領する約7,000枚の月報兼請求書をデータ化することに成功しました。

各支店で受領した月報兼請求書を「invoiceAgent」でOCR処理し、データとして一元管理する仕組みを整備。

必要な書類を速やかに検索できるようになり、ドライバーや協力会社から寄せられる過去の書類に関する問い合わせ対応が効率化されました。

▼事例詳細はこちら
株式会社ロジクエストのinvoiceAgent導入事例をもっと見る

手書きの「お客様情報確認書」をデジタル化(スルガ銀行)

case_suruga.png

スルガ銀行株式会社は、「継続的顧客管理」における業務負担軽減に「invoiceAgent」を活用しています。

顧客から回収する「お客さま情報確認書」に記入された手書き文字を「invoiceAgent」のOCR/AI OCR機能でデータ化し、CRMシステムに取り込む仕組みを構築。

従来の手作業による処理と比べ、月間で420時間分、年間で5,000時間分の作業負担削減を見込むなど、大きな効果を実感されています。

▼事例詳細はこちら
スルガ銀行株式会社のinvoiceAgent導入事例をもっと見る

アンケートの自動集計

手書きアンケートのデータ化に「invoiceAgent」を活用した事例です。

ウイングアーク1st株式会社では、マーケティングの一環としてイベント時にアンケートを実施していました。
しかし、手書きのアンケートをシステムに入力したり集計したりといった作業負荷が大きく、イベント後の営業フォローの遅れにより商談機会を損失するケースもありました。

「invoiceAgent」の導入後、OCR/AI OCR機能でアンケートの手書き文字やチェック項目を効率的にデータ化し、データ入力の作業工数を大幅に削減。
さらに、「MotionBoard」とのデータ自動連携連係により、イベント中のリアルタイム集計・可視化を実現しています。

「invoiceAgent」に搭載されている注目のOCR/AI OCRエンジン

現在、特徴が異なるさまざまなタイプのOCR/AI OCRが登場しています。
ここでは、高精度AI OCRで紙文書をデータ化する「invoiceAgent AI OCR」にも搭載されている、注目のOCR/AI OCRエンジンの特徴を紹介します。

ABBYY FineReader Engine(ABBYYジャパン)

「ABBYY FineReader Engine」は、ABBYYジャパン株式会社が提供するOCRエンジン。
20年以上にわたる開発で培われた高度なOCR技術を誇り、日本語や英語はもちろん、最大210言語のOCR処理に対応しています。
200ヶ国以上・5000万人以上が使用しており、抜群の実績と信頼性が特徴です。

(参考:ABBYY FineReader Engine: ICR、OBR技術を搭載した最高のOCR SDK

Tegaki(Cogent Labs)

「Tegaki」は、株式会社Cogent Labsが提供する手書き文字認識を得意とするAI OCRです。
ディープラーニングを活用した独自のアルゴリズムによって、さまざまな手書き文字を99.22%という高認識率でデータ化することができます。
活字・手書き文字のどちらにも対応可能なので、フォームごとに使い分ける手間が不要な点もポイントです。

(参考:Tegaki | 手書き文字をデータ化するAI OCR

DEEP READ(EduLab)

「DEEP READ」は、株式会社EduLabが提供するAI OCRサービスです。
AIによって金融・教育・官公庁などあらゆる業界の3万件以上のデータと照合し、手書き文字を瞬時にテキスト化することができます。
また、罫線などの余分な情報を除いてデータ化できる点も特徴です。

(参考:DEEP READ|印字・手書き文字のデジタル化サービス(AI-OCR)

CLOVA OCR(LINE)

「CLOVA OCR」は、LINE株式会社が提供するAI OCRサービスです。
定型文書の読み取りを得意とする「定型」、非定型文書の読み取りを得意とする「非定型」、請求書の読み取りに特化した「特化型」の3タイプを提供しています。
とくに「特化型」は、事前設定を行わなくても請求書特有の項目を高精度に認識・データ化することが可能です。

(参考:CLOVA OCR | LINE CLOVA公式サイト

WingArc Data Capture(ウイングアーク1st)

「WingArc Data Capture」は、ウイングアーク1stが提供する「invoiceAgent AI OCR」に搭載されているAIベースのOCRエンジンです。
活字(英数・日本語)だけでなく手書き(英数)にも対応し、日本語の文字コードを下記の通り幅広く対応しているのが特徴です。

  • JIS第1水準
  • JIS第2水準
  • JIS第3水準
  • JIS第4水準
  • JIS補助漢字

また、選択肢から回答するチェックボックス形式や丸囲い形式も高い精度で認識・データ化することが可能です。

まとめ

今回は、OCRの基礎知識から活用事例までご紹介しました。

OCRを活用することで業務を効率化できるだけでなく、文書情報をデータとして扱うことが可能になります。

文書にまつわる業務効率改善やデータ活用の促進に課題を感じている企業は、今回ご紹介した情報も参考にOCRの活用を検討してみてはいかがでしょうか。

【事例】文書の電子化によりペーパーレスを実現!

・請求書の正確なデータ化により年間185時間の工数削減
・領収書や請求書などの文書を電子化し、電子帳簿保存法へ対応
文書管理ソリューション「invoiceAgent文書管理」により、ペーパーレス化・業務効率化に成功した事例をご紹介します。

  • 電子帳票ナビ
  • OCRとは?意味やメリット・事例、「AI OCR」についても解説!

あわせて読む

帳票の電子化に役立つ資料を
無料でダウンロードできます

このページのトップへ