Sigfoss ワークショップ「OCR解説/LINE-READER編」

今月もやってまいりました、エンジニアによるワークショップ。
今回のお題は、CTOによる「OCR解説/Line-Reader編」
Sigfossの事業内容の中核を担っているAI-OCR 。最近はおかげさまでお問い合わせも多く、また、導入いただいている企業様からもご好評です。

◼︎Sigfoss OCRに期待すること
帳票、証憑書類の人的ミス・コスト削減
⇨今まで膨大に時間とコストをかけていたデータ入力や単純作業に終止符が打てます
「使えないOCR」からの脱却
⇨従来のOCRは定義設定に意外と時間がかかっているのが現状で、結果手でやっちゃった方が早いじゃんが無くなります。Sigfoss OCRなら定義設定は不要!
ワーク・ライフ・バランスの実現
⇨「AI-OCR導入でアフター5が充実した」「残業時間が減ったので体調不良で会社を休むことが少なくなった」等の本人も会社もハッピー現象
ペーパーレスの実現
⇨データのみでのやり取りが実現出来れば、紙の削減が可能

つまりは工数・コスト削減ですが、人的負担も軽減できちゃいます。もちろん「AIが最初から最後まで全部やってくれる」ことは不可能なので、多少人間の目で確認作業は必要です。有限な時間を有効に使ってキャリアアップも目指せることでしょう。

◼︎毎度おなじみワークショップ風景
"OCR"の文字だけ偶然いい感じに写ってます!


技術のコア部分は社外秘となるため、あまり詳しくはお伝えできませんがお許しください。
Sigfoss OCR の構成は、以下5つ。
1. 帳票分類
2. 回転補正
3. 文字列検出
4. 文字検出行構成
5. 構造化

1~2までは、オープンソースでも可能ですが、3からは Sigfoss 独自の技術を用いています。Line-Readerにはシングルだったり、マルチだったりバリエーションがあるらしく。制限はあるけどマルチだと一気に何行も読めるんですね。文字の切り出し方法とか、数学要素満載でやっぱり難しい。まず日本語が、難しい。
他の社員に「Aki、なんのことだかわかる?(ニヤニヤ)」ってからかわれながら約一時間のワークショップは終了しました。またどこかのタイミングでOCRについてワークショップする予定とのこと。学習編だったような。楽しみですね!

◼︎余談
たまに営業に来る若者さんが仮面ライダーが好きみたいで「今度の仮面ライダーはAI会社の社長みたいですよ」と言っていました。もう放送されてるみたいなのですが、ちょっと見てみたい気がします。

暑い日が続きますね〜。梅雨もやっと明け、夏本番です。スーパー暑い。みなさま熱中症やら体調不良には気をつけてください。
夏といえばここ2-3年毎年海に行っているのですが、いつも海の家でお酒飲みながらだらだらするだけなので、いつかサーフィンしたいです。道具とかやるまでが大変そうなのでハードル高いですが...

最後まで読んでいただきありがとうございます。
次回はCEOによる技術ブログ更新です。物体検知シリーズが続いているので、また物体検知かもしれません(笑)