こんにちは、エクスチュアの權泳東(権泳東/コン・ヨンドン)です。
今回はAdobeDWHレポートとBigQueryの連携でつかえる小技です。
AdobeAnalyticsのデータウェアハウスレポートをCSV配信する時に、「精度」を「日」にすると、ファイルの一列目に「日付」が入ります。
しかし、この日付が厄介です。
BigQueryにそのままロードするとこうなります。
ExcelでCSVを開くならこれでも良いんですが、BigQueryで扱うならこの「December 17, 2018」という文字列をPARSE_DATE関数で日付型に変換すると扱いやすくなります。
SELECT PARSE_DATE('%B %e, %Y', date) AS date FROM `mydataset.mytable`
結果はこのとおり、YYYY-MM-DD形式のDATE型になります。
PARSE_DATE関数の引数についてはこちらに詳細が記載されてます。
PARSE_DATE
おまけ
AdobeのDWHの日付カラムと違って、Adobe Datafeedならばhit_time_gmtというヒットタイムスタンプが存在します。
しかしhit_time_gmtのタイムゾーンは読んで時のごとくGMTのため、DATE関数でタイムゾーン「Asia/Tokyo」を指定するとJSTになります。
SELECT DATE(hit_time_gmt, 'Asia/Tokyo') as hit_time_jst from `mydataset.datafeed`
今回はAdobeDWHレポートのCSVファイルの日付カラムをBigQueryで日付型として扱うための小技について紹介しました。
弊社ではAdobe認定エキスパート資格とGoogleCloud認定プロフェッショナル・データエンジニアの資格を保持したエンジニアがデータ分析基盤の構築支援業務を行っております。
お問い合わせはこちらからどうぞ。
ブログへの記事リクエストはこちらまで