OCR(光学文字認識)の開発に着手しました

先日、補助金申請のアドバイスを受けるため、商工会議所の紹介で中小企業診断士の方に申請方法について相談しているときに、中小企業の中でも20名以下の小規模事業者の実態の話になりました。

請求書や領収書は未だに紙媒体で取り扱って、電子帳簿保存法にも対応していないところが多い現状を聞きしました。

電子媒体で保存と聞いて一番最初に思い浮かぶのがOCRですが、インターネットでOCRで検索するとOCRの機能を使うだけでもサブスクで結構な金額を支払わされます。ほとんどのものは金額が提示されておらず相談してくださいというのが多いです。

従業員100名以上の企業であれば月々10万円は許容できますが、20名以下の企業では10万円は悩む金額だと思います。

OCRで精度が良くなる手法として、CRAFT(Character Region Awareness for Text Detection)という機械学習モデルによるテキスト抽出器と、CRNN(Convolutional Recurrent Neural Network)という機械学習モデルによるテキスト検出器を使うのが良いらしい。英語は既に用意されている機械学習モデルがあるが、日本語は学習が必要との情報もあり、やってみないとなんとも言えないところではありますが、完成させたい。

文字認識さえできてしまえば、Chat-GPTでおなじみのLLM(大規模言語モデル)を使って抽出したテキストの内容から必要なものを選び出すことにより、ある程度の自動化が可能になります。

従業員20名以下の企業様において、月額10,000円+導入時の他アプリへの連携(API呼び出しなどによるちょっとした開発)の費用(100,000円~)を目安に提供できるようにしたいと思います。