ログイン

画像認識には前処理(補正処理)が必要です!

 2019.9.10 ゴリラーブログ ブログ 異世界ゴリラー新里

まだまだ暑い今日この頃ですが、これから徐々に涼しくなり秋がやってきます。

春は桜を見て楽しむ花見がありますが、秋は月を見て楽しむ月見の季節!(らしい!)

また、紅葉を眺めながら散歩してみるのもいいなと思っている異世界ゴリラー新里です。

 

さて、今回は画像認識に戻って少し技術的な話をしてみようかなと思います。

 

■画像認識には大事な処理がある

画像認識を実施時(学習時や認識時)に、とても大事な処理があります。それが、前処理(コンピューターが画像を認識しやすくするための処理)です。

前処理には、いくつかのパターンがありますが、例えば、

①INPUT画像の輪郭がぼやけているなら、輪郭をはっきりさせる。

②INPUT画像が斜めに歪んでいるなら、回転や傾きを補正する事で、真っ直ぐな状態にする。
(画像を2値化して境界をはっきりさせたり、平滑化(スムージング)したり、傾き補正(スキュー補正)したりする方法があります)

といった感じで、状況によって様々な前処理があり、実施する認識処理に対して適切な前処理を施しておく事で、より正確な画像認識が行える様になります。

 

■手書き文字認識における前処理(傾き修正)

文字認識を実施する際も、もちろん前処理は必要になります。

活字の文字認識であれば、傾きを補正したり、2値化したり、輪郭を補正したりするだけでも割りと高い認識率が出せたりします。

 

では、「手書き文字認識であればどうなるか?」恐らく、殆どの場合は活字の文字認識率に比べて、認識結果が良くない状態になる思います。その理由として、手書き文字の場合、INPUT画像そのものを真っ直ぐに補正したとしても、画像内の文字そのものが斜めに書かれていたり潰れていたりすると、上手く認識できない事が多いからです。

 

その為、手書き文字認識では画像内の文字そのものに対しても、補正処理を実施しておく必要があります。また、傾きだけでなく文字としてのバランスも合わせて補正する事で、より高い認識率へと持っていく事が可能となります。

 

■まとめ

画像認識で、色々な手法を用いて認識率を上げていく際に本当に大事なことは、如何にコンピューターが認識しやすいINPUTデータを作成できるかになります。もちろんそれだけと言うわけではないのですが、私の中では7割~9割は前処理(補正処理)が大事だと認識しています。これから画像認識をやってみる事があれば、前処理を意識してやる事をお勧めします!

© 2019 Mountain Gorilla Co., Ltd.