every Tech Blog

株式会社エブリーのTech Blogです。

エブリーのデータ組織の取り組み紹介

はじめまして。株式会社エブリーの開発本部のデータ&AIチームでマネージャー兼データサイエンティストをしている伊藤です。

今回は、エブリーのデータ組織が普段どういった取り組みを行なっているかを、簡単にご紹介したいと思います。

エブリーについて

株式会社エブリーは、「DELISH KITCHEN」「トモニテ」「TIMELINE」という3つのメディアを運営しています。 各メディアはそれぞれ主力となるサービスがあり、それらを起点に多岐に渡る事業を展開しています。

どのメディアも戦略上「データ」が不可欠となっています。

サービスのグロースのためのKGI・KPIのモニタリングはもちろんですが、 広告事業でのクライアント様向けの媒体資料や、OMO事業におけるオフラインデータの活用など、 データを起点とした取り組みは数多く実施されています。

チームObjective

データ&AIチームでは、「データ資産を最大限活用した事業運営の実現」をObjectiveに掲げています。

このObjectiveが達成された状態は、2つに分けられます。

  1. データ資産が適切に使える状態になっている
  2. データ資産の活用が事業改善に貢献している

前者は、サービスの動きやサービス内外で発生したユーザーの行動が正しく収集され、利用したい人が誰でも利用できるようになっている状態で、 データ基盤やBIツールの提供・データガバナンスなどが関連します。

後者は、データによって適切な意思決定がなされたり、データを使って事業価値が創出されている状態で、 データ分析や効果検証・統計モデル・機械学習などが関連します。

これら2つの状態は、どちらか片方だけでは不十分で、両方が機能して初めて data-driven / data-informed な意思決定につながるため、 それらを両立させるのがデータ&AIチームとしてのミッションだと考えています。

開発体制

2023年9月時点で、データ&AIチームは「データエンジニア」1名、「データサイエンティスト」3名、「データストラテジスト」1名が在籍しています。

それぞれの定義や担当領域は諸説ありますが、エブリーでは主に以下のようになっています。

  • データエンジニア: データ収集・分析基盤の構築と改善、データガバナンスの強化
  • データサイエンティスト: グロース施策の分析・効果検証、ロジック改善
  • データストラテジスト: マーケティングソリューションにおける営業支援

これらは大きな括りとしては分割されていますが、他の領域にまたがった取り組みを行う場面も多くあります。

例えば、データサイエンティスト・データストラテジストが、モニタリングや分析のために新しいデータが必要になったら、 基本的にはデータ取得処理の実装まで含めて担当します。

分業体制にできるほどの人数がいないという側面もありますが、 スキルの属人性を緩和しつつ、 大元のデータを活用できる状態に加工する経験を通してデータに対する解像度を上げられる、といったメリットもあると考えています。

技術スタックは、主要なものを挙げるとおおよそ以下のようになっています。

  • インフラ系: AWS、GCP、terraform
  • データ基盤系: Databricks、TreasureData、Fivetran
  • データ分析系: Redash、streamlit
  • プログラミング言語: Python、Scala、SQL (SparkSQL、Prestoなど)
  • ML系: MLflow、FastAPI (ML API)
  • AIツール系: Github Copilot、OpenAI API

主な業務内容

ここでは、データ&AIチームが日頃取り組んでいる業務のうち、直近のものをいくつかをピックアップして紹介します。

データカタログ構築

現在データ基盤は様々な利用者に使っていただいていますが、 「欲しいデータがどこにあるか分かりづらい」「テーブルのカラムの定義が分からない」といった課題がたびたび挙げられていました。

そこで、データエンジニア中心にデータカタログの構築を進めました。

いくつかの実現方法に関してPoCを行い、結果的にいくつかのツールを跨いでメタデータを収集できるOpenMetadataを採用しました。

インフラはAWS上に構築しており、現在はデータカタログの普及に向けた取り組みを実施しています。

効果検証

主にデータサイエンティストが、PdMやエンジニアと連携し、日々の施策の効果検証を担当しています。

効果検証はA/Bテストを選択することが多く、実験設計の部分から最後の意思決定の部分まで、データサイエンティストが並走するケースが多々あります。

直近では、細かいクリエイティブの改善に割く工数を削減するため、バンディットアルゴリズムの導入も進めています。

PR強化プロジェクト

これまで、マーケティングソリューションの課題の1つに、トレンド予測などのプレスリリースの少なさがありました。

プレスリリースは公開までに少なくない労力が必要ですが、営業メンバーの方が直近のトレンドを正しく把握するのに有効な側面に加え、 メディアとしてデータ資産を日頃利用いただいているユーザー様に還元できるという社会貢献としての側面もあります。

このプロジェクトはデータストラテジストと広報・管理栄養士が連携して進めており、

  • データストラテジストが探索的な分析ができるダッシュボードを作成
  • 広報・管理栄養士を交えて議論しつつ、トレンドの探索どダッシュボードの調整を進める
  • 発信の方向性が決まるとデータの整形と発信内容の調整を実施

といった流れで、データストラテジストを起点に各自の持つドメイン知識をうまく集約させたプロジェクトになっています。

直近はチョコミントに関するプレスリリースが発信され、いくつかのメディアでも取り上げていただいております。

データ組織としての直近の取り組み

また、データ組織として、直近は以下のような取り組みを行っています。

勉強会の実施

データ分析や機械学習などのスキルを身につける上では、実践的な経験に加えて、数学などの基礎知識の継続的な学習も重要になります。

そこでデータ&AIチームでは、数式に向き合う時間を作ろうという名目で、有志のメンバーで輪読会を開催しています。

過去何度か社内で勉強会を開催したり参加したりしてきましたが、予習と発表資料の準備はそこそこの負担になっていたため、 この輪読会は担当者がその場でホワイトボードに書きながら読み進める、という形式をとっています (そのため、内容が難しい場合には参加者全員が頭を抱えてほとんど進まないまま終わる回もあります)。

現在は「統計的機械学習の数理100問 with Python」という書籍を扱っています。 週に1時間のペースで、2023年9月時点で開始から1年半以上(最近ようやく最終章に入りました)続いており、今では比較的古参の取り組みになっています。

社内ChatApp作成

最近ChatGPTのような生成AIを組み込んだサービスやツールが日々増加している中で、それらを日常的に触れて肌感を掴み、 より良い活用の仕方を考え業務改善に活かしていくスキルが求められつつあります。

そのような動きを社内で高めていくため、データ&AIチームとして社内ChatAppを作成・提供する取り組みを行いました。

リリース時のSlackメッセージ

ChatAppはOpenAI APIをベースに動いており、入力した情報が学習に使われないよう設定できるため、ChatGPTよりも業務利用の敷居が下がっています。 また、GPT-4も社員は誰でも無料で使用できるようになっています。

ChatAppの作成は、チームで作ってみようという話題が出た翌週に、1日時間をとってデータエンジニア・データサイエンティストの2名で一気に作り上げた、 という点は地味なアピールポイントになっています。 また、作成においては以下の記事を参考にさせていただきました。

このような、メンバーの経験値になり、かつ業務にも役立つような取り組みを熱量を持って遂行するような動きは、今後もチームとして増やしていきたいと考えています。

今後の取り組み

最後に、データ組織としての今後に向けた取り組みを紹介します。

データ基盤の継続的な改善

現在のデータ基盤は幅広い事業部にデータを提供し利用いただいている状態ですが、 コストをはじめ、品質や提供速度など、より改善できる部分は多々存在しています。

また、利用者が使いやすいBIツールの設計や、見られなくなってしまうダッシュボードの管理方法なども、取り組むべき課題として挙がっています。

直近ではOpenMetadataを使ったデータカタログを作成しましたが、それをいかに社内普及させていくかもホットな課題です。

これらは一気に解決できるものではないですが、 チームとしては継続的に選択肢を検討し続ける状態を作り、少しでも良い状態を目指したいと考えています。

データによる技術更新の推進

現状DELISH KITCHENを初め、サービス内部には様々なロジック(検索やレコメンドなど)が埋め込まれています。

それらのほとんどは、サービス初期の頃に作成されたルールベースのアルゴリズムや、精度が継続的に評価されていないモデルになっており、 改善の余地が多く残されている状態です。

ユーザー様の利用体験を少しでも向上させるために、現在はサービスとロジックが適切に分離された状態を導入する取り組みを始めています。

サービスとロジックの分離がなされることで、データサイエンティストがロジックの改善に集中できる環境になりつつ、 必要であればロジックを前提としたUXの設計にも取り組めるようになると考えています。

今は少しずつ導入事例を増やしていく段階ですが、将来的にはインフラも整備しつつよりスケールする基盤を構築していけるよう取り組んでいきたいです。

おわりに

データ&AIチームの直近・将来に向けた取り組みを、簡単にご紹介しました。

エブリーのデータ組織に興味を持っていただいた方の解像度が少しでも上がるような内容になっていると幸いです。

より詳しい話を聞きたい方は、カジュアル面談をお申し込みいただけると嬉しいです!

corp.every.tv