第5回【Tableau GA User Group】何問解けるかな?Tableauを使ってGA4データをリアルタイムで分析してみよう!
2022/08/31(水)20:00
〜
21:30
開催
ブックマーク
画像
-
当イベントのアジェンダは、お題データの説明とメインの「何問解けるかな?」チャレンジの2セッション。
-
ちょっとクセのあるGA4データと上手く付き合う方法と題してGA4データの性質と注意点を木田さんが解説。
-
GA4が格納されているBigQueryの構造はどうなっている?今回のお題データはどこにある?を実際のBigQuery画面のデータプレビューを見ながらご紹介。
-
BigQueryからGA4データを取り出すにはSQLの実行が必要。今回のお題データはこのように出力しました!
-
GA4の3つの主要指標のカウント方法。後続の分析チャレンジでも大いに役立ちましたが、実務でも生かせる情報です
-
BigQuery上のGA4データを取り扱う際の留意点を3つご紹介
-
ここからメインセッション「難問解けるかな?GA4の分析にチャレンジ」。解説やTableauのTipsを交えたトークとともにお届けしました。
-
一問目はUUを出す問題。木田さんの解説を参考に皆さんにもTableauで作業しながら参加していただきました。
-
一問目の答えはこちら。幹事の中でも読み方で盛り上がった”Pseudo”IDのユニークカウント=UUでした。
-
お題は全部で5問。当日参加できなかった方も添付のスライド資料や動画を見ながらぜひチャレンジしてみてください。
お題データ
当イベントで使用したお題データは下記URLからダウンロードして頂けます。
https://drive.google.com/drive/folders/1G5S5WZHkGQSuWlkedq6mnhKl-tT6CtdT
スライド
当イベントのプレゼン資料は下記リンクからご覧いただけます。
https://drive.google.com/file/d/1Js0hdZSas6s8vqx-OAmgzE688BwT2MJW/view?usp=sharing
動画
※後日JTUGのYoutubeチャンネルにて公開予定
皆さんの質問にお答え!
2022年8月31日(水)に開催した、第5回【Tableau GA User Group】何問解けるかな?Tableauを使ってGA4データをリアルタイムで分析してみよう!内で頂いたご質問に回答します!
質問1
{fixed user_pseudo_id:countd(ga_session_id)}で正しいセッションの数を取得することはできますか?
回答1
可能です。ただし「user_pseudo_id」と「ga_session_id」で文字列連結を行いユニークカウントを行う方が簡単です。
LODを使用することで計算をすることは可能ですが、クエリパイプラインによるフィルターの順番の影響を考えたり、LODによるパフォーマンスを考えていくことが必要になります。
質問2
BigQueryのデータからデフォルトチャネルグループ別の集計は可能ですか?
回答2
可能ですが、以下の3つのステップが必要です。
①セッションに対する最初の参照元/メディアのイベントを取得する
↓
②directにおいて過去に意味のある参照履歴がある場合、directではなく、過去の
履歴を参照する
↓
③ ①と②で求めた参照元/メディアをグループピングする
※回答2の詳細
①について
UAでは参照元メディアは1セッションに対して1つだけでしたが、GA4では参照元メディアがイベントベースになっているため1つのセッションに複数の参照元メディアが
紐づく可能性があります。
そのためwindow関数を用いて1セッションが開始したときのの参照元メディアを取得する必要があります
②について
UA,GA4でのレポート画面ではdirectで参照しても過去に意味のある参照履歴がある場合directとは表示されずに過去の参照履歴が適応されます。
(例:過去にorganicで入ってその後directで流入した場合に2回目の参照元はdirectではなくorganicになる)
Bigqueryでは、自動で上記の処理を行ってくれないでSQLで過去に参照履歴がないかを確認して、あった場合は参照元を書き換える処理が必要になります。
③について
①と②のあとにデフォルトチャネルグループの定義をもとにグループピングを行います。
③は簡単ですが①と②をミスなく行うのが大変です.....
質問3
業務でユーザー数、セッション数、ページビュー数の軸が違うSQLを書く自信がないです、、
SQLのコツとかってありますか?
回答3
GAのレポートではユーザー、セッション、ページビューが一緒に表示されますが、ユーザー軸でのデータ、セッション軸でのデータを用意するというように割り切った方が
データとして扱いやすいものになります。GAのレポートで表示されているものを無理してSQLで書く必要はないです。
SQLを練習したい人は木田さんの本で練習しましょう!