【レポート】AWSの最先端クラウド技術と導入事例:クラウド技術最前線![第2部]- TECH PLAY Conference 2017
写真サービス『はいチーズ!』 Rekognitionを利用した顔検索機能の事例紹介
続いては「AWS」を導入している千株式会社の宮里さんの講演です。
宮里新司(みやざと・しんじ)/千株式会社 SREチームリーダー。沖縄県出身。東京、沖縄での複数社の勤務を経て、2017年に千へ入社。映画好き。
宮里さんが勤務する千では、スクールフォト販売サービス「はいチーズ!」を展開しています。
従来、幼稚園や保育園でイベントが実施される際には、職員がフォトグラファーを手配し、撮影した写真を廊下などに掲示。職員が保護者から代金を回収する形でスクールフォトの販売が行われていました。
「はいチーズ!」は幼稚園、保育園に通う子供を持つ保護者が、自身のスマートフォンからスクールフォトを購入できるサービスです。「はいチーズ!」を導入すると、職員の手間は一切不要になり、保護者はいつでもどこでも気軽に写真が購入できるメリットがあります。
現在は全国約5000の団体で導入されている「はいチーズ!」ですが、ひとつの課題がありました。それは、時に1万枚以上に及ぶという大量に撮影された写真の中から、保護者が自分の子供の写真を探し出すのに時間がかかるというものです。
この課題を解決する「顔検索機能」を実装したいと考えた宮里さんですが、「安くて、速くて、精度が高い」顔認識製品に出会えずにいました。そして、たどりついたのが「Amazon Rekognition」です。
「Amazon Rekognition」で顔検索を行うためには、顔コレクションを作成する「CreateCollection」、顔の特徴を表すベクトルを顔コレクションに追加する「IndexFaces」、指定した画像で顔コレクション内の類似画像を検索する「SearchFaceByImage」という3つのAPIを使用。検索結果は「JSON」形式で返されます。
宮里さんは「『IndexFaces』を実行する際、検出した顔と画像を紐付けるための任意文字列『external-image-id』には『/』が使えないので、設計時に考慮が必要」とtipsを共有しました。
実際に「Amazon Rekognition」を導入して、他のサービスと比較した際の優位性を宮里さんは5点挙げます。
- 「S3」上の画像を直接処理できる
- 1日数十万枚処理できる、顔メタデータ作成のスケーラビリティがある
- 顔メタデータの保持コストが安い
- 日本人かつ幼児でも認識精度が高い
- 数万件以上の顔メタデータから、数秒で検索結果が応答される
この「Amazon Rekognition」を「はいチーズ!」に組み込むにあたり、宮里さんは経営層の承認をとる必要がありました。ただし、文書や口頭で説明しても伝わりにくいと考えた宮里さんは、でもアプリを開発。当日の会場でもそのデモを実際に実施し、見事に識別に成功しました。
実際にサービスに「Amazon Rekognition」を導入するにあたり、直面した課題が2つあったと宮里さんは続けます。
1つ目はリージョンの問題。「はいチーズ!」の写真は東京リージョン上の「S3」に保管していましたが、「Amazon Rekognition」は東京リージョンに対応していませんでした。
1億枚以上ある写真の画像を「Amazon Rekognition」に対応するリージョンの「S3」コピーすると、当然コストは2倍になってしまいます。そこで、顔メタデータ作成後は「S3」のライフサイクル機能で元画像を自動削除するように設定することで解決しました。
もうひとつは、集合写真を上手く認識できないという問題です。これは「Amazon Rekognition」で顔検出できる上限は15人であること、顔の部分が一定以上の大きさがないと検出できないという制約から生じていました。そこで「IndexFaces」を分割して実行することで、集合写真をカバーできるように設計して解決しました。
最後に宮里さんは「はいチーズ!」のシステム構成と、画像アップロードをしなくても顔検索を利用できるようにするという今後の展望を語って、講演をまとめました。当日のスライドはこちらに公開されています。
次のページ :
IoTオートスケレーションサービス enebularを実現するAWSの技術