Amazon Rekognitionの顔検出が本当に良くなっていた

こんにちは、田中です。

AWSの開発者会議 re:Invent2017 で画像認識サービスの Amazon Rekognition の顔検出の機能強化が発表されていました。

aws.amazon.com

機能強化の内容は

リアルタイム顔認識（何千万という顔のコレクションに対してリアルタイムの顔検索）
イメージ内のテキスト認識のサポート
機能強化された顔検出（人混みモードの顔検出）

です。

このうち、ユニファの写真事業でもっとも関連の高い機能となる、「人混みモードの顔検出」の改善度合いを調べてみました。

人混みモードとは

以下の画像は上記のWebページからの画像引用になります

https://aws.amazon.com/jp/blogs/news/amazon-rekognition-announces-real-time-face-recognition-support-for-recognition-of-text-in-image-and-improved-face-detection/

このように群衆が写っている写真からの顔検出になります。

集合写真は園イベントに欠かせないものであり、保護者のニーズも強く実際によく売れています。^^

で、集合写真での顔検出はどれくらい改善したの??

以前、ユーザー購入写真5000枚を対象にRekognitionを使って顔検出したことがありました。

そのとき、集合写真もしくは集合写真に準ずる写真のうち顔が1つも検出できなかった写真は 111 枚ありました。

これらの写真を対象にもう一度、顔検出してみました。

すると、

顔検出できなかった写真はなんと 10 枚だけでした

以前は写真が少しでもボケていたりすると集合写真ではまったくと言っていいほど顔が検出できなかったのですが新しくなったRekognition では相当数が検出できるようになってました。

驚きあるのみです

動画からの顔検出（Amazon Rekognition Video）

画像認識機能の進化の目玉はこちらかもしれません。

クラスメソッドさんが早速記事を書いてくれています。

dev.classmethod.jp

私もコンソール画面から試してみました。

まず、サンプル動画で試す

動画中に検出された顔が左に表示され、選択した顔の出現区間がオレンジのバーで表示されます。 f:id:sanshonoki:20171220160350j:plain

出現しなかった区間はオレンジのバーからちゃんと外れています。 f:id:sanshonoki:20171220160042j:plain

うーん、すごいです。

オフィス内動画で試す！

続いてオフィス内で動画を撮影し試してみました。15-30秒の動画だと約3分ほどで分析が終了しました。

まず、一番驚いたのが、、

顔がまだ写ってない区間も出現区間として検出されている！

f:id:sanshonoki:20171222205914j:plain

これはすごい。

検出した顔を元に時間方向にオブジェクト追跡しているのでしょうか。

顔でないものが検出されていたり、明らかに顔なのにそれが検出されていなかったり、顔検出が微妙なところがあるのですが顔検出できた顔に関して出現区間はおおよそ納得がいく結果でした。

＜顔検出がうまくできなかった例＞

f:id:sanshonoki:20171222212944j:plain

最後に園内動画でも試した

最後に、園内動画をいくつかピックアップし試してみました。（園の許可なく公開できないのでキャプチャ画像はありません..）

オフィス内動画の結果に比べると残念な結果でした。。

顔の数が多い
子どもの顔は大人の顔より区別がつきにくい

ためでしょうか。

ただ、Rekognitionの登場からわずか1年で動画対応できたそのスピードを考えると来年にはどこまで進化しているのか期待を寄せずにはいられません。

デモでアップロードできる動画は以下の制限がありますがこの機能は面白いのでぜひ使ってみてください。（自分の手持ちの動画を使うときはS3バケットを作成する必要があります）

movはだめ。h.264でエンコードされたmp4のみ
動画は1分以内、ファイルサイズ30MB以下（仕様は8GBまでいける）

るくみーには動画撮影機能もあるので引き続きRekognitionをウォッチしていきたいと思います！

ユニファ開発者ブログ

ユニファ株式会社プロダクトデベロップメント本部メンバーによるブログです。