Adobe Analytics

Adobe Analytics: DatafeedのログからパスフローレポートをBigQueryで作成する

こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。

以前このブログでAdobeのフォールアウトレポートをBigQueryで再現しましたが、今回はパスフローレポート(次ページのフロー)をBigQueryで再現します。

今回も、Adobeのデータフィードは既にBigQuery上にデータセット名「datafeed」、テーブル名「hit_data」にロードしている前提で進めます。

弊社トップページからのパスフロー

ext:index.htmlからの2ページ先までのフローを抽出します。
SQLクエリは長いので毎度のようにgithubに載せておきます。

実行結果はこのようになります。

start … 起点ページ
start_cnt … 起点ページのインスタンス数
next1 … 次のページ。離脱した場合はnullになる。
next1_cnt … next1に遷移したインスタンス数
next1_rate … next1への遷移率
next2 … 次の次のページ。離脱した場合はnullになる。
next2_cnt … next2に遷移したインスタンス数
next2_rate … next2への遷移率

という結果のレポートになります。
リロードを考慮してないので、リロードが発生すると同じ名前のページ名が連続して出てきます。

以下、何をやってるか簡単に説明します。

1. まずは冒頭のCTE(with句) 「base」 において、各ヒット毎にpost_pagenameと、その「次のページ」と、「次の次のページ」をLEAD関数で抽出します。

2. 次のCTE 「flow」 では、起点ページであるext:index.htmlと、その後のページの発生件数(インスタンス)をカウントします。

3. 3番目のCTE 「base2」 では、起点から2ページ先までのインスタンスと遷移率を出してます。

4. 全部表示するとデータが多すぎるので、2番目の遷移ページは上位5件に絞っています。

今回はAdobe AnalyticsのDatafeedログとBigQueryを使ってパスフローレポートを作成する方法について説明しました。

弊社では、Adobe認定エキスパート資格とGoogleCloud認定データエンジニア資格を持ったエンジニアが、Adobe Analyticsのデータフィードと、その他のデータソースを統合した分析基盤をGoogle Cloud Platform上に構築するサービスを提供しております。
お問い合わせはこちらからどうぞ。

ブログへの記事リクエストはこちらまで

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Adobe Analytics

    Adobe新タグ登場って本当?AEP Web SDKって何だ?

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。Ado…

  2. Adobe Analytics

    はじめてのAdobe Analytics実装

    前回までの3回のブログで、イメージリクエストやアクセス情報の取得の原理…

  3. Adobe Analytics

    Adobe Analytics: BigQueryにロードしたデータフィードをDataStudioで…

    こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。…

  4. Adobe Analytics

    イベント前の時間とは-Adobe Analyticsの指標説明

    こんにちは。インターン生の市川です。今回はイベント前の時間を説明いた…

  5. Google BigQuery

    Big QueryでWindow関数を用いて、累積和を計算する

    こんにちは。エクスチュアでインターンをさせて頂いている中野です。…

  6. Adobe Analytics

    Ad Hoc Analysisを用いてセグメント作成を効率化する

    こんにちは、インターン生の丸山です。AAによる分析にあたり、セグメン…

最近の記事

  1. Snowflakeや最新データ基盤が広義のマーケティングにも…
  2. 回帰分析はかく語りき Part3 ロジスティック回帰
  3. GCSへのSnowflake Open Catalogによる…
  4. VPC Service Controlsで「NO_MATCH…
  5. モダンデータスタックなワークフローオーケストレーションツール…
  1. ヒートマップ

    クリック・ヒートマップの使い方
  2. Matillion Practitioner Certification

    Matillion

    Matillion Practitioner Certification 合格体…
  3. IT用語集

    グリットコンピューティング(Grid Computing)って何?
  4. ブログ

    エクセル関数の基礎
  5. Python

    pythonを使ったダミーデータ生成
PAGE TOP