Tableau

Tableauのリレーションシップを理解して過剰結合を防ぐ

リレーションシップとは

Tableau Desktop 2020.2の新機能で、ザックリいうと「これまで1から結合を定義していたものを、Tableauが自動で調整してくれる」という機能です。
ユーザーにとって嬉しいポイントとしては「粒度の異なるデータをくっつけて分析できる」という点で、これにより中間テーブルを定義せずに済み、レコード増加によるパフォーマンスの悪影響を抑えることができます。
リレーションシップ自体は大変便利な機能で、一般的な「結合」の上位互換となるのですが、データ量が膨大になる時には注意しなければなりません。
合言葉は「カーディナリティ(濃度)」です。

カーディナリティ「1対多」「多対多」の使い分け

リレーションシップで「パフォーマンスオプション」を開くと、カーディナリティの項目が現れます。
※デフォルトでは「多対多」で設定されています。

この「多対多」はデータの粒度を細かく扱うことを表しています。
実際にTableau Desktopでの挙動から、カーディナリティが何を指すのか見ていきましょう。
まず、「注文」と「売上目標」という2つのテーブルを[オーダー日]でリレーションを組んでいきます。

オーダー日やカテゴリなどを適当に配置すると、以下のようになります。
各日付ごとの詳細なデータが格納されていることが確認できました。

次に、リレーションを「多対一」にしてみます。

すると、先ほどの表は以下のようになります。

今回は[オーダー日]でリレーションを組んだので、オーダー日の単位でデータが丸められました。
このようにカーディナリティを調整することにより、データの粒度を変更することができるのです。
これはデータ量が多い時にかなりパフォーマンスに“差”が出ます。
また、場合によっては「キーが不十分でデータを過剰に結合してしまう」ということも生じます。
Tableauのリレーションシップは大変便利な機能で、ほとんどのユーザーはこれを気にしなくても良いです(多分
しかし、システムの中核をデザインする立場であれば、このように細部までこだわっていきたいところです。
Tableauや総合研究所に関する質問はお問い合わせからどうぞ。

KARTE Blocks データプランナーの強い味方!!前のページ

CXツール「KARTE」ってどんなツール?主な機能や魅力をざっくり紹介!次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Tableau

    Tableau Serverの基礎をまとめてみた

    【目次】・はじめに・Tableau Serverが必要な理由・環…

  2. Tableau

    【2019年版】Tableau Desktop Certified Associate 受験レポート…

    はじめにこんにちは!インターンの與那覇(ヨナハ)です今回は私が昨日…

  3. Tableau

    動的なリファレンスラインで個別に閾値(しきい値)を設定【Tableau】

    完成形リファレンスラインを動的に設定することのメリットリファレン…

  4. Tableau

    Tableau Tips〜WINDOW関数〜

    はじめにこんにちは!インターンの與那覇(ヨナハ)ですこれから不定期…

  5. Tableau

    あなたのTableau(タブロー)が重い理由【パフォーマンスの記録】

    はじめにTableauを利用している人のほとんどが経験しているであろ…

  6. Google BigQuery

    BigQueryのユーザー定義関数(UDF)をTableauで使う

    こんにちは、エクスチュアの渡部です。今回はTableauでstan…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


カテゴリ
最近の記事
  1. データ連携を自動化!Fivetranの概要・料金とスプレッド…
  2. Adobe WebSDK クロスドメイン計測【第2部】FPI…
  3. Adobe WebSDK クロスドメイン計測【第1部】ECI…
  4. Adobe Target Recommendations:g…
  5. Conversational Analytics APIでお…
  1. Adobe Analytics

    Adobe Analytics Business Practitionerが変わ…
  2. Google Tag Manager

    GTMでiframe内のクリックイベントを取得したい
  3. GA 360 Suite

    GoogleDataStudio:複数のデータソースにフィルターを適用する
  4. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する
  5. Adobe Experience Cloud

    Adobe Summit 2020レポート: Unravel Customer …
PAGE TOP