IT用語集

DWH(Data Warehouse)、データマート(Data Mart)って何?

はじめに

今回はデータ界隈で必須単語である「データウェアハウス(DWH)」と「データマート」の意味とその違いについて説明します。
言葉の意味を理解していないとゴッチャ(混同)になることも多いです。
それでは早速見ていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

DWH(Data Warehouse)・・・企業内で蓄積されたデータが1つの場所で整理されているデータベース。
データマート(Data Mart)・・・特定の目的のために加工されたデータベースのこと。

DWHとデータマートの意味とその違い

これらの単語の意味をザックリ説明すると

データウェアハウス(DWH)=「会社内の全てデータが格納された大規模なデータベース
データマート=「必要なデータのみが集められた小〜中規模のデータベース

となります。
語源から考えると「WareHouse = 倉庫」「Mart = 小売店」なので、用語自体は覚えやすいですよね。
全体のデータを一元管理するDWHが理想」とされているのですが、今だにデータマートを軸に考えてる企業も少なくないです。
理由はデータマートは小規模で特定のデータのみが管理されているので「環境構築にかかるコストが小さく特定のデータにアクセスしやすい」という特徴があるからです。
DWHが理想とされる主な理由は「企業データは日々増え続ける」「データマートのデータは断片的なものとなってしまう」「データマートの数が膨大になれば収集がつかない」ということです。膨大なデータを管理することがマストな現代で、大量の重複データを個別(バラバラ)に管理するということは非常にリスクが高いです。また長期的なことを考えても運用コストや安全面から見ても、DWHを持つことはメリットしかないです。その役目を担うのがIT部門というわけなんですね。

おわりに

いかがでしたでしょうか。
「Warehouse = 倉庫」「Mart = 小売店」の意味から推測すれば、もう忘れることはないですよね。
データマートを一気にDWHに移行する事は非現実的なので、導入を検討する際は強引に進めすぎないことがポイントです。
この記事を通して「データマート」「DWH(データウェアハウス)」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️

参照元

.https://data.wingarc.com/what-is-database-2-4836
.https://data.wingarc.com/what-is-data-mart-12075
.https://jp.talend.com/resources/what-is-data-mart/
.https://www.teradata-jp.com/post/2018/07/05/データウェアハウス-vs-データマート
.https://www.gixo.jp/blog/12313/
.https://it-trend.jp/dwh/article/149-0005

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    サブルーチン(Sub Routine)・メインルーチン(Main Routine)って何?

    はじめにルーチンってなんか響きが嫌ですよね、、ルーチンとは、ルーテ…

  2. IT用語集

    アドイン(Add In)・アドオン(Add On)って何?

    はじめにIT業界に身をおく方なら「アドイン」「アドオン」は少なくとも…

  3. IT用語集

    ナレッジマネジメント(Knowledge Management)って何?

    はじめに「Knowledge + Management = 知識 +…

  4. IT用語集

    コンフィギュレーション(Configuration)って何?

    はじめにコンフィギュレーションって聞きなれない単語ですよね。。直訳…

  5. IT用語集

    サマリー(Summary)って何?

    はじめにビジネスでもITの世界でもよく使われる「サマリー」という単語…

  6. IT用語集

    スキーマ(Schema)って何?

    はじめにスキーマとはスキーム(計画)の前段階の状態のことで、それが転…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. 回帰分析はかく語りき Part3 ロジスティック回帰
  2. GCSへのSnowflake Open Catalogによる…
  3. VPC Service Controlsで「NO_MATCH…
  4. モダンデータスタックなワークフローオーケストレーションツール…
  5. Streamlit in Snowflakeによるダッシュボ…
  1. Tableau

    【手順解説】MacでRedshiftに接続できない時の原因と対処法【Tablea…
  2. Google BigQuery

    OWOX BI: GoogleSheetsアドオンでBigQueryをお手軽ビジ…
  3. Mouseflow

    Mouseflowを採用するWebサイトが10万を突破!
  4. Mouseflow

    mouseflowのプライバシー設定はシンプルで直感的なVisual Priva…
  5. Google BigQuery

    Big QueryでWindow関数を用いて、累積和を計算する
PAGE TOP