Tableau

Tableauのリレーションシップを理解して過剰結合を防ぐ

リレーションシップとは

Tableau Desktop 2020.2の新機能で、ザックリいうと「これまで1から結合を定義していたものを、Tableauが自動で調整してくれる」という機能です。
ユーザーにとって嬉しいポイントとしては「粒度の異なるデータをくっつけて分析できる」という点で、これにより中間テーブルを定義せずに済み、レコード増加によるパフォーマンスの悪影響を抑えることができます。
リレーションシップ自体は大変便利な機能で、一般的な「結合」の上位互換となるのですが、データ量が膨大になる時には注意しなければなりません。
合言葉は「カーディナリティ(濃度)」です。

カーディナリティ「1対多」「多対多」の使い分け

リレーションシップで「パフォーマンスオプション」を開くと、カーディナリティの項目が現れます。
※デフォルトでは「多対多」で設定されています。

この「多対多」はデータの粒度を細かく扱うことを表しています。
実際にTableau Desktopでの挙動から、カーディナリティが何を指すのか見ていきましょう。
まず、「注文」と「売上目標」という2つのテーブルを[オーダー日]でリレーションを組んでいきます。

オーダー日やカテゴリなどを適当に配置すると、以下のようになります。
各日付ごとの詳細なデータが格納されていることが確認できました。

次に、リレーションを「多対一」にしてみます。

すると、先ほどの表は以下のようになります。

今回は[オーダー日]でリレーションを組んだので、オーダー日の単位でデータが丸められました。
このようにカーディナリティを調整することにより、データの粒度を変更することができるのです。
これはデータ量が多い時にかなりパフォーマンスに“差”が出ます。
また、場合によっては「キーが不十分でデータを過剰に結合してしまう」ということも生じます。
Tableauのリレーションシップは大変便利な機能で、ほとんどのユーザーはこれを気にしなくても良いです(多分
しかし、システムの中核をデザインする立場であれば、このように細部までこだわっていきたいところです。
Tableauや総合研究所に関する質問はお問い合わせからどうぞ。

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Tableau

    最年少DATA Saberになって感じたこと〜Tableau〜

    【目次】・自己紹介・DATA Saberとは・DATA Sabe…

  2. Tableau

    Tableau:累計ユニークカウント数を時系列グラフで表現する

    こんにちは、エクスチュア渡部です。Tableauの小ネタです。「T…

  3. Tableau

    Tableau:分かりやすいLOD-概要編

    こんにちは、エクスチュアの渡部です。今回からLOD計算について、複…

  4. Tableau

    Tableau Bridgeをザックリ理解する

    Tableau Bridge(タブローブリッジ)とはTableau …

  5. Tableau

    Tableau:分かりやすいLOD-FIXED編

    こんにちは、エクスチュアの渡部です。LODブログ第二弾です。今回は…

  6. Tableau

    あなたのTableau(タブロー)が重い理由【パフォーマンスの記録】

    はじめにTableauを利用している人のほとんどが経験しているであろ…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. 【GA4/GTM】dataLayerを使ってカスタムイベント…
  2. 【GA4/GTM】dataLayerを活用しよう
  3. ジャーニーマップをデジタルマーケティングの視点で
  4. ChatGPT ProからClaude3 Proへ移行した話…
  5. その分析、やり方あってる?記述統計と推測統計の違い
  1. ブログ

    ダッシュボードに使うべき10のグラフ②
  2. ObservePoint

    ObservePointの価値とは
  3. Google Apps Script(GAS)

    GoogleスプレッドシートのデータをGASで整理する【setValue・set…
  4. IT用語集

    DTM(Dynamic Tag Manager)って何?
  5. Amplitude

    Amplitudeを知る。
PAGE TOP