最先端ディープランニング活用事例大集合! - Deep Learningオールスターズ2017 -
2017年6月25日13時より「Deep Learningオールスターズ2017」が開催されました。
本イベントは様々な領域の最先端で活躍されている方々をお招きし、「TECH PLAY」が主催する「オールスターシリーズ」のディープラーニング版。ディープラーニングを利用して事業を運営している企業のエンジニアの方々を招き、実際にどのようにディープラーニングが導入されているのか、成功例、失敗例を交えてお話いただきました。
毎回人気の「オールスターシリーズ」とあって、当日は約170名が参加しました。
当日の登壇者とテーマは以下の通りです。
「史上初!あのチームラボがGPUを使い倒した結果」
チームラボ株式会社 加藤哲朗さん
チームラボ株式会社 林輝大さん
株式会社 IDCフロンティア 金杉有見子
「ニューラルネットワークのその次へ」
Retty株式会社 氏原淳志さん
「Deep Learningの世界に飛び込む前の命綱」
TIS株式会社 嘉村準弥さん
「ファッションアイテム検索における深層学習の活用」
株式会社VASILY 中村拓磨さん
「3Dデータへの深層学習の適用」
株式会社カブク 足立昌彦さん
「Chainerで知るDeep Learning進化の歴史」
株式会社レトリバ 舛岡英人さん
それでは内容を紹介します!
史上初!あのチームラボがGPUを使い倒した結果
最初の登壇はチームラボの加藤さん、林さん、IDCフロンティアの金杉さんの3名です。チームラボがGPUへの取り組みを発表するのはこの場が世界初! 3名からは計約40分のお話をいただきました。
まずは、加藤さんより「デジタルアートにおけるディープラーニング」をテーマにした発表です。
ディープラーニングがレストランを演出?
加藤哲朗(かとう・てつあき)/チームラボ株式会社コンピュータビジョンチーム。神奈川県出身。東京工業大学卒。2010年、コンピュータビジョンチームの立ち上げメンバーとして、チームラボに入社。「バーミキュラ」のホーロー鍋を愛用。
テクノロジーとクリエイティブの境界が曖昧になりつつある昨今、チームラボは「実験と革新」をテーマにソリューションの受託開発を提供しています。受託開発ではウェブサイトやスマートフォンアプリから次世代自動販売機まで様々なプロジェクトを実施。
また、デジタルサイネージとカメラ、モーションセンサーを組み合わせ、SNSと連携した「teamLabCamera」や、イラストがデジタル上の水槽で泳ぎだす「お絵かき水族館」などプロダクトとしてもデジタルアートを提供しています。
加藤さんは多岐にわたるディープラーニングを使った事業のなかから、「SAGAYA」の事例を紹介します。
「SAGAYA」は、レストランでコース料理を食べるときにその空間を演出したプロジェクト。テーブルに料理の皿が置かれると、天井に取り付けられたカメラが皿を画像認識し、蝶が舞う、花が咲くなどの映像が美しく展開していきます。映像は季節や料理に合わせて月に一度で更新しています。ここでのディープラーニングのポイントは次のとおり。
- センシングのベースとなる1フレームごとの検出に「Single Shot MultiBox Detector(SSD)」を使用
- 画像を1回feed forwardするだけで検出と識別を行えて、高精度かつ高速
- お皿の検出問題に合わせてチューニングをし、手などでお皿が隠れても安定して検出可能
実装環境として、ライブラリは「SSD」の作者がforkした「Caffe」を利用。リリース時には1万枚の画像データセットを用意し、そのうち500枚は手作業でラベリングしました。
メインGPUは「TITAN X」。IDCフロンティアからクラウドのGPUインスタンスを借りています。
加藤さんはディープラーニングを使ってよかった点として、「膨大な量のデータセットを用意しなくても『fine-tuning』で十分な精度の識別器がつくれたこと」、「料理が乗っていたり、手が触れたりしていても高い精度で皿の認識ができたこと」を挙げます。今後は学習にかかる時間をもっと短くしていき、メニューの更新を簡単にできる仕組みづくりを進めていきたいと加藤さんはまとめました。
ログが無くても、高精度なレコメンドを実現!
続いて、チームラボの林さんから「レコメンドパッケージにおけるディープラーニング」に関する講演です。
林輝大(はやし・てるひろ)/チームラボ株式会社 テクノロジーDiv。1989年生まれ。長野県出身。長野工業高等専門学校卒。2012年にチームラボ株式会社に新卒入社。イチローのファン。
いまやECサイトにおいて、消費者の購買行動に大きく影響与えているレコメンドエンジン。チームラボでも独自の協調フィルタリングを使って取り組み、ユーザーの行動ログから商品をレコメンドするアルゴリズムを構築しています。しかし、林さんは「ログのない商品に対するレコメンド精度が低いこと」を課題に感じていました。
そこで、チームラボでは弱点克服のために、社内の論文読み会で紹介されていた「Collaborative Deep Learning(CDL)」の導入に動き出します。
「CDL」とは「Matrix Factorization(MF)」で抽出したアイテムベクトルと商品情報を、「Deep Neural Network(DNN)」で取り出した中間層のベクトル(=商品特徴)に近づけていく手法です。これにより、コンテンツ情報からユーザーの行動による特徴を抜き出すことが可能となり、ログがなくてもユーザーの行動からレコメンドができるようになります。
「CDL」は商品に対するレーティングデータを想定していません。そのため、よくあるECサイトのログを「CDL」で利用するケースでは、「購買されればされるほど、クリックされればされるほど評価が高い」という置き換えを行うことで行動データを利用するようにしました。加えて、情報量の大きい商品画像を利用するために、情報量の大きいために「Auto-Encoder」で次元圧縮した特徴が抽出不可な部分に全結合層を追加しました。
林さんは、実際にチームラボのエンジンを導入しているアパレルECサイトのクリックデータを利用した実験を紹介します。実験に使ったのは、全54万以上のユーザーのうち、20種類以上の商品をクリックした17,329人のデータ。商品をランダムで100件選択し、その商品からログを取り除きます。つまり、全くログを持たない商品のデータができるわけです。そして、ユーザーがクリックした商品をランダムに5件モデルとして与え、ログを持たない商品があっても適切なレコメンドができるのかを試しました。
モデルとして与えたのは、「商品画像」と「商品説明文」どちらのケースでも、ログのないデータから一定の精度のレコメンドを達成しました。
最後に林さんは実験から得られた結果、課題を次のようにまとめました。
- 性能評価
定量的な指標をもとに効果を比較して、今後の設定を考える必要がある。 - 「MF」の高速化
並列性能が悪く、分散処理が不得意。 - 「CDL」のチューニング
パラメータを変更しても性能に影響を与えていないように感じるため、定量的な評価を入れないといけない。 - 大規模データの処理
スケールするためには計算リソースを並列で用意する必要がある。コスト的にGPUクラウドが必要不可欠。
チームラボが導入するクラウドGPUの3つのメリット
このテーマの最後スピーカーは、チームラボにクラウドGPUを提供したIDCフロンティアの金杉さんです。
金杉有見子(かなすぎ・ゆみこ)/株式会社 IDCフロンティア プロダクト企画部 企画グループ。ワシントン大学工学部電機工学科卒業。2015年IDCフロンティア入社。ONE OK ROCK好き。
金杉さんは、GPUクラウドサービスを使うメリットについて次の3点を説明しました。
- クラウドサービスとの親和性
GPU以外にも周辺サービスである、ストレージやビッグデータの解析基盤などをクラウドで一括利用することで、学習と推論2つのPhaseにおいてそれぞれメリットがあります。
学習Phaseにおいては、データの収集で安価かつ容量制限なしのクラウドストレージサービスが使え、クローラーも低スペックでスタートできることがメリットです。推論Phaseにおけるメリットは、学習用GPUをそのまま本番で使用できるため、再構築の時間が不要であること、ファイヤーウォール機能がデフォルトでついているのでセキュリティにも安心であることが挙げられます。
- すぐに、簡単に使える
「CUDA」、フレームワーク、「Jupyter」などを丸ごとDockerイメージでクラウド環境へインポート。ローカルの開発環境と同様にハイスペックなGPUのパワーを効率よく利用することが可能です。
- 従量課金のメリット
プロジェクトの運用後に追加で学習が必要になったとき、ネットワーク代込みで1時間400円から利用が可能で、初期費用も不要です。
次のページ :
ニューラルネットワークのその次へ