目次

1. はじめに

近年、生成AIやエージェントAIなど、高度なAI活用が大きな注目を集めています。エージェントAIなど最先端技術を駆使した業務効率化の事例を目にすると、自社でも取り組まなければ、と思わずにはいられなくなるのも事実でしょう。

一方で、実際の業務現場では、

・紙帳票が残っている

・手書き情報を人手でエクセルなどに転記している

・そもそもデータ化されていない

といったケースも少なくありません。

現場目線で見ると、「AI活用やDXなどに取り組む前に、まず既存業務のデータ化や整理をどう進めるか」が現実的な課題になっている場面も多いように感じます。

今回、ある案件で「手書きされた表形式のPDFをExcelへ転記する」という作業に触れる機会がありました。

業務としてはシンプルですが、帳票数が増えるほど入力工数は大きくなり、確認作業も含めると相当な負荷になります。

正直なところ、「今でもこうした紙ベースの運用は意外と多いのかもしれない」と感じました。

もちろん、今回の案件でなぜ紙運用が採用されていたのか、詳細な背景までは分かりません。

ただ、弊社にお問い合わせいただくお客様の多くが関わっている製造業や医療などの領域では、現場では今なお紙ベースの帳票や設計図などを使った業務が残っているケースは珍しくないとも伺っております。もし一部でもデジタル化することができれば業務の負担を減らすことができるかもしれません。一方でデジタル化のプロセス自体が手間となってしまっては、それも本末転倒になってしまいます。

そこで今回は、この転記作業を生成AIでどこまで効率化できるのかを、サンプルを通して検証してみることにしました。

本来であれば、転記作業にはOCR専用アプリやAI OCRサービスを利用する方法が望ましいかもしれません。しかし今回は、あえて専用OCRツールは使用せず、ChatGPTのみでどこまで対応できるのかを試してみました。

というのも、ChatGPTが登場した当初は、「文章生成や要約を行うAI」といったように、テキストに特化したAIと印象でしたが、現在は以下などにも対応し、より汎用的なAIツールへ進化していると考えられたからです。

・画像認識

・画像生成

・表データ理解

・コード生成

また、専門のOCRアプリをインストールして色々設定する手間もなく、画像を用意してプロンプトを自分の言葉で入力しながら作業を進めることができる手軽さも、生成AI活用に踏み出しきれない方々にとっての第一歩として適しているのではないか、という思いもあります。

そこで今回は、

「ChatGPTを使うと、紙のデータ入力の工数をどの程度削減できるのか?」

という観点で、実際に手書き帳票を使って検証してみました。

2. 検証用の手書き帳票を作成

今回は、検証用にサンプル帳票を作成しました。ChatGPTで手書き風の帳票を作成させる方法もありですが、それでは”出来レース”になってしまうかもしれません。今回は実際に筆者が手書きで作成しました。

題材として選んだのは、運賃表を模した表形式のデータです。

この帳票には、以下が含まれており OCRとしては比較的精度に課題が出そうな構成になっています。

・手書き文字

・運賃などの数値

・細かい表構造

・1セル内に複数段の情報

また、実際の現場に近い条件を想定し、以下の調整も行いました。

・セル内の記入位置も多少ばらつかせる

・崩した筆跡とする

・帳票をスマホで撮影する

OCRの検証では、綺麗に整ったサンプルを用いるのではなく、「実際に現場で発生しそうな読みづらさ」を含めて評価することが重要だと考えたからです。

3. 人手でExcelへ転記した場合

まずは比較対象として、筆者自身が帳票をExcelへ転記しました。筆者はブラインドタッチはできますが、特に素早いタイピングができるわけではなくデータ入力の作業を日常的に行なっていません。その辺りを考慮した結果であることをご承知おきください。

結果は以下の通りです。

・入力作業:約11分

・確認作業:約3分

・修正箇所:1箇所

修正箇所は1箇所で「改定」とすべきところが「改訂」となっていました。

実際に作業した所感としては、入力そのものも手間がかかりますが、入力しながら原本とエクセルの数値を照らし合わせる確認作業に時間がかかる印象でした。

特に手書き文字では、数字の読み違いや入力セルの間違いなどが起きていないかといった細かな確認作業が継続的に発生します。

一見単純な転記業務ですが、長時間続けると集中力も必要になり、人的負荷は決して小さくありません。正直なところ、この一枚でも結構疲れます。

今回はこの一枚のみの作業でしたが、仮にこれが数百枚などになると、その作業は何十時間にも及ぶでしょうから、その作業の大変さは想像に難くありません。

4. ChatGPTでOCRしてみた

次に、同じ帳票画像をChatGPTへアップロードし、Excel形式で出力させてみました。

使用したプロンプトは非常にシンプルです。

「この運賃表の画像を読み取って、エクセルに出力してください。」

20秒ほど経って下記のエクセルが出力されました。

・プロンプト入力:約10秒

・出力時間:約20秒

・確認作業:約3分

・修正箇所:7箇所

当然ながら、誤認識はいくつか発生しています。黄色いセルは文字が間違っていたり、読み取れていなかったりした部分です。

特に、以下の読み間違いが見られました。

・似た形の数字

・小さい文字

・罫線付近の文字

・細かな注釈

実際の誤認識例としては、本来「銚子」と記載されている箇所を「針子」と認識していたケースがありました。また、数字についても、「7」を「8」と誤認識している箇所が2箇所確認されました。

手書き文字では、わずかな筆跡の違いや線のつながり方によって、AI側が別の文字として解釈してしまうケースがあるようです。

また、セル内に二つの運賃が改行して記載されている原本に対して、新たに列を作成して情報を異なる形で網羅する表構成であったり、ヘッダーの名前が異なるなど「意味としては間違っていないが表そのものの情報から変化している」部分があったりするのも、興味深い点です。これについては次章で考察していきます。

5. ChatGPTは“文字”だけでなく“構造”も解釈していた

今回の検証で特に興味深かったのは、ChatGPTが単純なOCRとして文字を読み取るだけでなく、「表構造」そのものを解釈していた点です。

例えば、原本では1セル内に2段で記載されていた運賃情報を、ChatGPT側が独自に別列へ分割して出力していました。これは、「元の見た目をそのままExcelへ再現する」という観点では、評価が分かれる部分かもしれません。

実際、帳票再現を目的とする場合にはセル結合などを使って複数の情報をひとまとめにするなどの視認性優先のレイアウトが重要になるケースもあります。

しかし、そのままでは、CSVなどの形式でデータベース化をすることで検索や集計などを容易にすることやシステム連携といった処理を行いづらくなるケースも少なくありません。そうした点では今回のように、AI側が情報を分割・整理して出力することで、行データ構造がすっきりして後続システムで扱いやすくなるといったメリットも見えてきます。

単純に「OCR精度が高いか」だけではなく、「データとして扱いやすい形へ変換できるか」

という視点も、今後のAI OCRでは重要になるのかもしれません。

6. OCR AIは“完全自動化”ではない

今回の検証では、ChatGPTだけで完全に正確なデータ化ができたわけではありません。最終的な確認や修正は、人手で必要になります。そのため、「OCR AIを導入すれば人が不要になる」という話ではないと感じています。ただし、“人がゼロから入力する工程”を削減できる効果は非常に大きいとも感じました。

実際、今回の検証では、

・入力作業 → AI

・確認作業 → 人

という役割分担に近い形になっています。これは現実的な運用として、非常に有効だと考えられます。特に紙帳票が大量に存在する現場では、「人は確認に集中し、入力そのものはAIへ任せる」という形だけでも、大きな業務改善につながる可能性があります。今回の検証では、全体工数をおおよそ4分の1程度まで圧縮できています。もしこれが数百枚、数千枚単位の帳票であれば、「4週間かかっていた転記作業が、1週間程度まで短縮される」といった可能性も十分考えられます。

7. まとめ

今回、ChatGPTを使って手書き帳票のOCRを検証してみました。もちろん、現時点では誤認識もあり、完全自動化には至りません。

しかし、手入力工数を大幅に削減できたり、表構造を理解して出力してデータ活用しやすい形へ整理できたり、といった可能性は十分感じられました。

生成AIというと、文章生成やチャット機能が注目されがちですが、実際にはこうした「紙データのデジタル化」も、非常に現実的な活用領域の一つです。特に、まだ紙文化が残る現場では、

「AIを導入する前に、まずデータを扱える状態にする」

という工程そのものが重要になるケースも少なくありません。生成AIの活用というと、高度なAIシステムや自動化が注目されがちです。しかし実際には、「紙に書かれた情報を、まずデータとして扱える状態にする」という工程こそ、多くの現場で最初に直面するテーマなのかもしれません。

8. ヒューマンサイエンスの教師データ作成、LLM RAGデータ構造化代行サービス

教師データ作成数4,800万件の豊富な実績

ヒューマンサイエンスでは自然言語処理に始まり、医療支援、自動車、IT、製造や建築など多岐にわたる業界のAIモデル開発プロジェクトに参画しています。これまでGAFAMをはじめとする多くの企業様との直接のお取引により、総数4,800万件以上の高品質な教師データをご提供してきました。数名規模のプロジェクトからアノテーター150名体制の長期大型案件まで、業種を問わず様々な教師データ作成やデータラベリング、データの構造化に対応しています。

クラウドソーシングを利用しないリソース管理

ヒューマンサイエンスではクラウドソーシングは利用せず、当社が直接契約した作業担当者でプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。

生成系AI LLMデータセット作成・構造化、「AIに最適化するマニュアル作成・整備支援」にも対応

データ整理のためのラベリングや識別系AIの教師データ作成のみでなく、生成系AI・LLM RAG構築のためのドキュメントデータの構造化にも対応します。創業当初から主な事業・サービスとしてマニュアル制作を行い、現在では「将来的な生成AI・RAG導入・活用に向けての業務ナレッジ整備やマニュアル化の支援」も行っております。さまざまなドキュメントの構造を熟知している当社ならではのノウハウを活かした最適なソリューションを提供いたします。

自社内にセキュリティルームを完備

ヒューマンサイエンスでは、新宿オフィス内にISMSの基準をクリアしたセキュリティルームを完備しています。そのため、守秘性の高いデータを扱うプロジェクトであってもセキュリティを担保することが可能です。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。リモートのプロジェクトであっても、ハード面の対策のみならず、作業担当者にはセキュリティ教育を継続して実施するなど、当社の情報セキュリティ管理体制はお客様より高いご評価をいただいております。

内製支援

弊社ではお客様の作業や状況にマッチしたアノテーション経験人材やプロジェクトマネージャーの人材派遣にも対応しています。お客様常駐下でチームを編成することも可能です。またお客様の作業者やプロジェクトマネージャーの人材育成支援や、お客様の状況に応じたツールの選定、自動化や作業方法など、品質・生産性を向上させる最適なプロセスの構築など、アノテーションやデータラベリングに関するお客様のお困りごとを支援いたします。