こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。
以前このブログでAdobeのフォールアウトレポートをBigQueryで再現しましたが、今回はパスフローレポート(次ページのフロー)をBigQueryで再現します。
今回も、Adobeのデータフィードは既にBigQuery上にデータセット名「datafeed」、テーブル名「hit_data」にロードしている前提で進めます。
弊社トップページからのパスフロー
ext:index.htmlからの2ページ先までのフローを抽出します。
SQLクエリは長いので毎度のようにgithubに載せておきます。
実行結果はこのようになります。
start … 起点ページ
start_cnt … 起点ページのインスタンス数
next1 … 次のページ。離脱した場合はnullになる。
next1_cnt … next1に遷移したインスタンス数
next1_rate … next1への遷移率
next2 … 次の次のページ。離脱した場合はnullになる。
next2_cnt … next2に遷移したインスタンス数
next2_rate … next2への遷移率
という結果のレポートになります。
リロードを考慮してないので、リロードが発生すると同じ名前のページ名が連続して出てきます。
以下、何をやってるか簡単に説明します。
1. まずは冒頭のCTE(with句) 「base」 において、各ヒット毎にpost_pagenameと、その「次のページ」と、「次の次のページ」をLEAD関数で抽出します。
2. 次のCTE 「flow」 では、起点ページであるext:index.htmlと、その後のページの発生件数(インスタンス)をカウントします。
3. 3番目のCTE 「base2」 では、起点から2ページ先までのインスタンスと遷移率を出してます。
4. 全部表示するとデータが多すぎるので、2番目の遷移ページは上位5件に絞っています。
今回はAdobe AnalyticsのDatafeedログとBigQueryを使ってパスフローレポートを作成する方法について説明しました。
弊社では、Adobe認定エキスパート資格とGoogleCloud認定データエンジニア資格を持ったエンジニアが、Adobe Analyticsのデータフィードと、その他のデータソースを統合した分析基盤をGoogle Cloud Platform上に構築するサービスを提供しております。
お問い合わせはこちらからどうぞ。
ブログへの記事リクエストはこちらまで