Adobe Analytics

Adobe Analytics: DatafeedのログからパスフローレポートをBigQueryで作成する

こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。

以前このブログでAdobeのフォールアウトレポートをBigQueryで再現しましたが、今回はパスフローレポート(次ページのフロー)をBigQueryで再現します。

今回も、Adobeのデータフィードは既にBigQuery上にデータセット名「datafeed」、テーブル名「hit_data」にロードしている前提で進めます。

弊社トップページからのパスフロー

ext:index.htmlからの2ページ先までのフローを抽出します。
SQLクエリは長いので毎度のようにgithubに載せておきます。

実行結果はこのようになります。

start … 起点ページ
start_cnt … 起点ページのインスタンス数
next1 … 次のページ。離脱した場合はnullになる。
next1_cnt … next1に遷移したインスタンス数
next1_rate … next1への遷移率
next2 … 次の次のページ。離脱した場合はnullになる。
next2_cnt … next2に遷移したインスタンス数
next2_rate … next2への遷移率

という結果のレポートになります。
リロードを考慮してないので、リロードが発生すると同じ名前のページ名が連続して出てきます。

以下、何をやってるか簡単に説明します。

1. まずは冒頭のCTE(with句) 「base」 において、各ヒット毎にpost_pagenameと、その「次のページ」と、「次の次のページ」をLEAD関数で抽出します。

2. 次のCTE 「flow」 では、起点ページであるext:index.htmlと、その後のページの発生件数(インスタンス)をカウントします。

3. 3番目のCTE 「base2」 では、起点から2ページ先までのインスタンスと遷移率を出してます。

4. 全部表示するとデータが多すぎるので、2番目の遷移ページは上位5件に絞っています。

今回はAdobe AnalyticsのDatafeedログとBigQueryを使ってパスフローレポートを作成する方法について説明しました。

弊社では、Adobe認定エキスパート資格とGoogleCloud認定データエンジニア資格を持ったエンジニアが、Adobe Analyticsのデータフィードと、その他のデータソースを統合した分析基盤をGoogle Cloud Platform上に構築するサービスを提供しております。
お問い合わせはこちらからどうぞ。

ブログへの記事リクエストはこちらまで

正規表現について前のページ

エクセル関数の基礎次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Adobe Analytics

    Adobe Analyticsを知る。

    Adobe Analyticsを知る。 -エクスチュアのツール紹介-ア…

  2. Adobe Analytics

    リファラーとは-Adobe Analyticsの指標説明

    今回はリファラーについて説明したいと思います。リファラーとはユーザ…

  3. Adobe Analytics

    DataWarehouseについて

    はじめまして、インターン生の丸山です。Adobe Analytics…

  4. Adobe Analytics

    Adobe Summit 2020レポート: Implementation Tips for Ado…

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。Twitt…

  5. Adobe Analytics

    Adobe Analytics: データフィードをBigQueryで集計する

    こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。…

  6. Adobe Analytics

    AdobeAnalytics: スマホのスワイプにカスタムリンクを実装する

    こんにちは、エクスチュアの権泳東/コン・ヨンドン(@exturekwo…

カテゴリ
最近の記事
  1. 【dbts25】Snowflake×PostgreSQLのニ…
  2. TROCCO dbt連携編
  3. KARTEの「フレックスエディタ(β)」登場!ノーコードでこ…
  4. dbt Projects on Snowflake使ってみた…
  5. Cortex Analystを使ってみた
  1. Enterprise Data Warehouse

    爆速データウェアハウスなApache Druidを試す
  2. Mouseflow

    【Tips】mouseflowで特定の流入経路からサイトを訪問した場合のみ計測さ…
  3. ブログ

    アドテック東京2014
  4. ブログ

    ダッシュボードに使うべき10のグラフ②
  5. Tableau

    上位N件セットを使って「その他」を効果的に表現する【Tableau】
PAGE TOP