Androidで画像認識～ナキウサギをOpenCVで認識してみた

2019年8月15日2023年3月28日

「改造したAR-J-GPSでナキウサギ画像を認識させてみた」

最近は画像認識の話題を良く目にします。画像認識の技術は、車の自動運転や防犯カメラ、ロボット、無人レジなど、さまざまな用途で利用されています。これから画像認識の利用は加速度的に進み、社会の激変が予想されます。

そこで、自分もいずれは画像認識のアプリケーションを作ってみたいということで、テストしてみました。画像認識を行うデバイスですが、Androidとラズベリーパイを候補として挙げました。そして、既に自作のAndroidアプリケーション「AR-J-GPS」があるので、Ar-J-GPSのAR画面で画像認識を行うことにします。

それでは、画像認識を行う時は、どのようなライブラリを使えば良いのでしょうか。

※ソースは精査されたものでないため、現時点では方法や手順について紹介します。

Contents

1. 1.TensorFlow Lite
2. 2.OpenCV 4
3. 3.分類器の作り方の概要
- 3.1. TrainingAssistantのセットアップについて
- 3.2. opencv_createsamples.exeがない
4. 4.画像認識の結果
5. 5.処理速度の考察
6. 6.まとめ

1.TensorFlow Lite

「TensorFlow Lite」は、googleから提供されているモバイル向け機械学習ライブラリです。googleが作るものですから、Android Studioでの開発には最適のライブラリでしょう。

TensorFlow

An end-to-end open source machine learning platform for everyone. Discover TensorFlow's flex ...

https://www.tensorflow.org/

「Lite」と名前が付くとおり、フルセットの「TensorFlow」からモバイル向けとして用意されたライブラリです。その使い方ですが、以下のサイトさんの記事が参考になります。

Cafe and Cookies.：TensorFlow Liteのデモを動かす（外部リンク）

私もやってみたのですが、途中で私の開発環境では重すぎて厳しいことが分かりました。今は非力なノートブックのみで開発しているので、リソースが不足してしまいます。残念ですが、私は違う方法を使うことにします。みなさんは「TensorFlow Lite」を試してみてください。

※後日、TensorFlow Liteで画像認識をやっています。当記事の最後にリンクを用意しています。

2.OpenCV 4

「OpenCV」は、画像や動画を処理するのに必要な機能をまとめたライブラリです。そのライブラリの中に、画像認識や機械学習の機能が含まれています。OpenCVは若干軽い構成なので、こちらを実装することにしました。

OpenCV - Open Computer Vision Library

OpenCV provides a real-time optimized Computer Vision library, tools, and hardware. It also supp ...

https://opencv.org/

まずは顔認証をしてみます。パッケージには、顔認証をするためのxmlがいくつか用意されています。

haarcascade_frontalface_alt.xml

を今回使ってみました。これらのxmlは「分類器」と呼ばれています。顔認識のやり方ですが、以下の記事が良いでしょう。

Qiita:Android + OpenCV 4 で、顔認識をする（外部リンク）

私もAR-J-GPSに組み込んでやってみましたが、認識率はお世辞にも高いとは言えません。結構ミスするし、なんとAndroid Studioの画面でも顔認証する有様です。サンプルが悪いのか、この程度の認識しかできないのかは謎です。

「AR-J-GPS」プレビュー画面に、検出した顔を四角で囲うようにしました。そしてgoogle検索画面でフリー画像を表示させて認識してみました。まあまあ認識していますが、もう少し認識率が高くなって欲しいところです。

さて、ナキウサギの分類器はありません。そのため、自作してみます。

3.分類器の作り方の概要

画像認識というとAIが賢く判断して何であるかを導き出すイメージですが、実際は大量の画像を登録して、近い画像があれば、それであると判定するのに過ぎないようです。そして判断に使う画像には、判断する対象部分を四角で囲んであげる必要があります。これを大量に用意することによって、画像に判断するものがあるかを判定します。

このように、AIというよりは大量のデータベースの中から近いものを探すといった方が正しいです。対象を作成者が枠指定しているので、AIとはちょっと違う気がします。

さて、分類器の作り方と使い方は以下の記事が良いでしょう。

shkh’s blog：OpenCV 2.4.2で分類器を作る（外部リンク）

分類器の作成の際、いろいろトラブルが発生しました。注意する点を以下に示します。

TrainingAssistantのセットアップについて

Githubの設定で以下のチェックアウトが必要とありますが、私の環境では設定すると「views.py」で枠の作成ができませんでした。同じ現象の人もいるようなので、まずは設定しないで動作させてみてください。

% cd static/Jcrop
% git checkout master

ももん2さんによる写真ACからの写真

TrainingAssistantで、ナキウサギの顔を四角で囲います。範囲を設定した後に他の場所をクリックして枠が赤色になると指定が有効になります。

opencv_createsamples.exeがない

分類器を作成する時に「opencv_createsamples.exe」が必要ですが、Open CVのWindows最新版ではソースしかありません。そしてビルドもうまくいかないようです。そのため、古いOpen CVをダウンロードする必要があります。私は「Open CV 2.4.11」を使用しました。