アーカイブ動画
月間840億件のログと、4.2億IDのリアル人流データを保有するunerry
unerryが提供するデータサービスや実際の活用について語ってくれたのは、データアナリストチームのリーダーである嶋﨑諒子氏と、データエンジニアチームのリーダーを務める徳山京周氏だ。
株式会社unerry
BeaconBank事業部データチーム
Leader of Data Analytics Team 嶋﨑 諒子氏
まずは、データアナリスト十数名からなるチームのリーダーを務める嶋﨑諒子氏が、unerryが提供するデータサービスや実際の活用について紹介した。
unerryは、スマートフォンによる位置情報をGPSとBluetoothビーコンの技術を活用し、同社のプラットフォーム上に蓄積している。屋外だけでなくビルの内部や地下構内などの人の動きを計測し、月間840億件超のログならびに、約4.2億IDのリアル人流データを保有している。
このようなビッグデータをデータベースとして集約すると共に、AI解析などにより、店舗や地域における行動分析や広告配信のターゲティングなど、大きくは3つのサービスを幅広い業界のクライアントに提供している。
データチームは、嶋﨑氏が所属するアナリストチーム、徳山氏が所属するエンジニアチーム、サイエンティストチームの3つから構成される。
ただしスライドを見てもわかるとおり、3チームの担当領域ならびにフェーズは重なることも多く「別の領域に挑戦することも可能です」と嶋﨑氏は述べる。実際、徳山氏はアナリストチームからエンジニアチームに移ったというキャリアを紹介した。
その中でもアナリストチームは、「クライアントにより近いポジションです」と、嶋﨑氏は語る。
自社以外、クライアントのデータも含めた分析を行うため、ドメイン知識や分析技術が求められると共に、データにおいても一般的なアナリストと比べ、「幅広いデータを扱っていると思います」と、特徴を述べた。
具体的な事例も4つ紹介された。まず1つ目は商業施設における、新店舗のプロモーションである。
ターゲットの属性や嗜好を分析した上で広告を打った結果、予想を大きく超えた売上を実現した。
2つ目は、小売店での集客状況などの把握である。店内での行動や滞在時間を収集することで、経営会議で使うデータなどに活用している。
3つ目は観光地を訪れる客の属性や移動手段、各スポットへの来訪傾向を分析した事例だ。また、データに基づき適切な情報配信を行うことで、より的確に移動を促した。
4つ目は、海外のインフラ事業者への情報提供だ。駅間の移動実態を把握することで、定期券の区間最適化などに活用していく。
ただし、単に人流データを把握しているだけでは、このような活用は実現しない。unerryが実現できているのは、行動データから属性や嗜好性などを抽出するAIを自社で開発しているからだ。その役割を担うのが、サイエンティストチームだ。
サイエンティストチームではその他にも予測モデルや生成AI活用など、既存案件の高度化に貢献するチャレンジも行っていると嶋崎氏は述べ、徳山氏にバトンを渡した。
株式会社unerry
BeaconBank事業部データチーム
Leader of Data Engineer Team 徳山 京周氏
徳山氏が所属するデータエンジニアチームの役割は、データ基盤の整備や運用を通じて、データ活用を支える土台を提供することだ。
しかし事業成長に伴い、データ量・メンバーが増加し、必要なデータを探しづらいなどの課題が生じるようになってきた。そこで現在は新しい基盤の開発に注力している。
大きくは3つのコンセプトで、「KASSAI DWH」という名称の新基盤の開発を進めており、特にコストの最適化、データメニューの提供を意識しているという。
アーキテクチャはGCPを活用し、シンプルな構成であること、DWHの設計においてはスタースキーマを採用したことを、徳山氏は重ねて紹介した。
コストの最適化については、位置情報データをジオハッシュの粒度と時間帯毎に集約したメニューを提供している他、unerry独自のジオパーティションを導入することで、BigQueryのスキャンコストやストレージコストの増大を抑えている。
ジオハッシュとは、位置情報を文字列として示すデータ構造であり、1つのエリアはおよそ5m✕4mである。新基盤ではこのジオハッシュの粒度にデータを集約することで、既存と比べ、約60%のデータ圧縮率を実現した。
もう一つ、unerry独自のジオパーティションでは、日本全国を地域ごとに大きさを変える工夫を施した800に分割する「unerryジオコード」を作成し、実装している。
「東京のようなデータが多いところでは分割を小さく、逆にデータの少ない地方で大きくすることでデータ量のバランスを取りました」(徳山氏)
徳山氏はこのように工夫を述べ、実際に約90%ものデータスキャンコストの削減を達成したと、その成果を語った。
もう一つの注力領域であるデータメニューにおいては、ビーコンから取得できるデータはもちろん、外部のオープンデータも新基盤を通じて得られるようにした。
今後は電気・ガス・水道といったインフラと同じように、unerryが持つビッグデータがどのような業界でも汎用的に使われる。徳山氏は以下のように、展望を述べ、セッションを締めた。
「このようなデータプロダクトレイヤーという仕組みも構築することで、どの業界でも効率的にデータを活用できる環境の構築を目指します」(徳山氏)
【Q&A】参加者からの質問に登壇者が回答
登壇セッションが終わった後は、イベント参加者からの質問に登壇者が回答する、QAセッションも行われた。抜粋して紹介する。
Q.ジオコードパーティションを指定する際の、クエリの処理や工夫について聞きたい
徳山:そのままクエリを書くのでは、ユーザーにとって大変な処理となるので、データチーム側で予めクエリのテンプレートを用意。そのテンプレートの変数を調整することで、ユーザーが望むジオパーティションの情報を得られるようにしています。
Q.ニーズが高かったデータソースや活用先は?
嶋﨑:人流データはとてもニーズが高いと思っています。活用先においては事例でご紹介した内容に加え、直近ではコロナ禍が明けて人流が戻ってきたこともあり、過去との比較といった需要が増えている状況です。