OCR(光学文字認識)の開発に着手しました

先日、補助金申請のアドバイスを受けるため、商工会議所の紹介で中小企業診断士の方に申請方法について相談しているときに、中小企業の中でも20名以下の小規模事業者の実態の話になりました。

請求書や領収書は未だに紙媒体で取り扱って、電子帳簿保存法にも対応していないところが多い現状を聞きしました。

電子媒体で保存と聞いて一番最初に思い浮かぶのがOCRですが、インターネットでOCRで検索するとOCRの機能を使うだけでもサブスクで結構な金額を支払わされます。ほとんどのものは金額が提示されておらず相談してくださいというのが多いです。

従業員100名以上の企業であれば月々10万円は許容できますが、20名以下の企業では10万円は悩む金額だと思います。

OCRで精度が良くなる手法として、CRAFT(Character Region Awareness for Text Detection)という機械学習モデルによるテキスト抽出器と、CRNN(Convolutional Recurrent Neural Network)という機械学習モデルによるテキスト検出器を使うのが良いらしい。英語は既に用意されている機械学習モデルがあるが、日本語は学習が必要との情報もあり、やってみないとなんとも言えないところではありますが、完成させたい。

文字認識さえできてしまえば、Chat-GPTでおなじみのLLM(大規模言語モデル)を使って抽出したテキストの内容から必要なものを選び出すことにより、ある程度の自動化が可能になります。

従業員20名以下の企業様において、月額10,000円+導入時の他アプリへの連携(API呼び出しなどによるちょっとした開発)の費用(100,000円~)を目安に提供できるようにしたいと思います。

DXが浸透しない理由を考えた

国策として2018年から助成金などを出してでも浸透させようとしているDXだが、経済産業省の資料を見ても取り組んでいる企業はまだマイノリティ側である。

デジタル革命というキーワードに興味がない人にとっては、DXは全然響かないし、やりたくても誰に頼めば良いか分からない。世の中金儲けしか考えていない輩の標的にはなりたくないので、変えたくても変えられない。

DXはそういうことじゃないんだよって言っている奴らこそが一番怪しい。。。

IT技術者というか俺の場合だけかもしれないが、自分が作ったシステムが稼働していることを実感できたとき、とても誇らしく思う。これは俺だけじゃないはずだ。

世の中に貢献するのは気持ち良いことだし、自分一人の利益のためとは考えない。会社員であれば、頑張ったって給料はさほど変わらないから尚更そうではないか。

IT技術者とはそういう気質を持っているのだとした場合、DXを通じて世の中がより良くなるのは稼げるからという理由だけではないはず。

ではなぜDX人材が不足していると言われているのか疑問になる。

最近、マイナンバーカードの返納騒ぎでニュース欄を賑わしているが、システムを構築した富士通が構築したシステムが不完全だったという事実しかないし、マイナンバーカードの普及の遅れは、世界経済に対する日本経済の遅れに通じる。良いことなど一つもないのは俺だって分かる。

ではなんでそんなシステムを作ったのか。大手は金儲け第一主義だからでは無かろうか。世のため人のためという考えは10位ぐらいなんじゃないか?!

日本は世界の先進国に比べれば、格差が小さいと言われており、経済発展は出来てないが、格差が小さい点で評価される珍しい国なんだそうだ。

そういう国のなかでも既得権益が更に儲けたいという欲望を抱く一部の富裕層がDX促進を拒んでいると私は思う。