IT用語集

DWH(Data Warehouse)、データマート(Data Mart)って何?

はじめに

今回はデータ界隈で必須単語である「データウェアハウス(DWH)」と「データマート」の意味とその違いについて説明します。
言葉の意味を理解していないとゴッチャ(混同)になることも多いです。
それでは早速見ていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

DWH(Data Warehouse)・・・企業内で蓄積されたデータが1つの場所で整理されているデータベース。
データマート(Data Mart)・・・特定の目的のために加工されたデータベースのこと。

DWHとデータマートの意味とその違い

これらの単語の意味をザックリ説明すると

データウェアハウス(DWH)=「会社内の全てデータが格納された大規模なデータベース
データマート=「必要なデータのみが集められた小〜中規模のデータベース

となります。
語源から考えると「WareHouse = 倉庫」「Mart = 小売店」なので、用語自体は覚えやすいですよね。
全体のデータを一元管理するDWHが理想」とされているのですが、今だにデータマートを軸に考えてる企業も少なくないです。
理由はデータマートは小規模で特定のデータのみが管理されているので「環境構築にかかるコストが小さく特定のデータにアクセスしやすい」という特徴があるからです。
DWHが理想とされる主な理由は「企業データは日々増え続ける」「データマートのデータは断片的なものとなってしまう」「データマートの数が膨大になれば収集がつかない」ということです。膨大なデータを管理することがマストな現代で、大量の重複データを個別(バラバラ)に管理するということは非常にリスクが高いです。また長期的なことを考えても運用コストや安全面から見ても、DWHを持つことはメリットしかないです。その役目を担うのがIT部門というわけなんですね。

おわりに

いかがでしたでしょうか。
「Warehouse = 倉庫」「Mart = 小売店」の意味から推測すれば、もう忘れることはないですよね。
データマートを一気にDWHに移行する事は非現実的なので、導入を検討する際は強引に進めすぎないことがポイントです。
この記事を通して「データマート」「DWH(データウェアハウス)」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️

参照元

.https://data.wingarc.com/what-is-database-2-4836
.https://data.wingarc.com/what-is-data-mart-12075
.https://jp.talend.com/resources/what-is-data-mart/
.https://www.teradata-jp.com/post/2018/07/05/データウェアハウス-vs-データマート
.https://www.gixo.jp/blog/12313/
.https://it-trend.jp/dwh/article/149-0005

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    シンクライアント(Thin Client)って何?

    はじめにシンクライアントとは、新クラアントのことではありません。シ…

  2. IT用語集

    IoT(Internet of Things)って何?

    はじめにIoT(アイオーティー)って数年前は頻繁にニュースに出てまし…

  3. IT用語集

    ユーザビリティ(Usability)って何?

    はじめにユーザービリティーとは「Use + able = 使う + …

  4. IT用語集

    コンフィギュレーション(Configuration)って何?

    はじめにコンフィギュレーションって聞きなれない単語ですよね。。直訳…

  5. IT用語集

    オンラインストレージ(Online Storage)って何?

    はじめにオンラインストレージとは字面の通り「オンライン上のストレージ…

  6. IT用語集

    イーサネット(Ethernet)って何?

    はじめにイーサネットってなんだかイーサリアム(2018年10月現在ビ…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. Mouseflowのセッションリプレイのしくみ
  2. LangChainって何?: 次世代AIアプリケーション構築…
  3. 1st Party Cookieと3rd Party Coo…
  4. Amplitudeで何が分かる?
  5. SnowflakeのHybrid Tableのマニュアルを読…
  1. ブログ

    DirectionAPI+Tableauでドライブ時間の可視化(前編)
  2. GA 360 Suite

    Google Analytics 360 + BigQueryでよく使うSQL例…
  3. Python

    わかりやすいPyTorch入門⑥(RNN:再帰型ニューラルネットワーク)
  4. ObservePoint

    ObservePointの価値とは
  5. セッションリプレイ

    【Tips】セッションリプレイについて
PAGE TOP