IT用語集

ビッグクエリ(Big Query)って何?

はじめに

「ビッククエリ = ビッグ + クエリ = 大きい + クエリ!?」と思われた方、お疲れ様です。
内容とは関係ないのですが、ビッククエリって本当に発音しづらいですよね。。
私(ヨナハ)だけかもしれないのですが、発音の際にいつも「ビククエリ」と言ってしまいます。(本当に言いにくい
さて冗談はこの辺にして、ビッグクエリの意味と使われ方について早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

ビッグクエリ(Big Query)・・・Googleがクラウドで提供するDWH。数TBのデータでも数秒〜数十秒程度で結果を返すことができる優れもの。

ビッグクエリとは

ビッグクエリとは「数十億行のデータの処理を”超”高速(数秒〜数十秒)で処理できる格安サービス」です。
速いことは理解していただけたと思うのですが、どれほど安いのかが気になりますよね。
なんと、クエリ料金は毎月「1TB(テラバイト) = 約500円」です。(安い
また、データの保存に関しては毎月「1TB(テラバイト) = 約2000円」です。(安い
「1TB = 1000GB」なので、私たちがスマホの通信制限で苦しんでいる毎月「8GB」というデータ量に比べたらどれだけ大きく、どれだけ安いのかということがわかります。
ビッグクエリの高速で格安なサービスを実現する仕組みは大きく2つあります。
①カラム構造データストア(=列毎に分割してデータを保存)
従来のデータベースシステムではデータを行単位で保存して処理を行うのですが、ビッグクエリでは「列単位でまとめてデータを保存」することでデータの運搬効率/圧縮性を上げることを可能にしています。(正確な仕組みはもっと複雑なのでここでは割愛)
②ツリーアーキテクチャー
ツリー式で処理を分散させることで「データの並列処理」を可能にし、その結果を高速に集約することでクエリの結果を出しています。
これら2つの技術はGoogle独自のものというわけではないですが「既存のGoogleのクラウド技術との相性」や「高性能な仕組みを格安で提供している」という点がビッグクエリが支持されている理由です。
他にも「データの暗号化と複製が自動で行われ安全性が高い」「アクセス権の管理が楽」「TableauGoogle Analyticsなど様々な製品と相性が良い」「自動でクエリを回すことができる」などなど多くの強みがあります。
私(ヨナハ)も、実際にTableau×Big Queryでデータの更新〜集計〜可視化というプロセスを全て自動化しています。
SQLがある程度かけてTableau Server/Onlineが使えればできるのでオススメです。

おわりに

いかがでしたか。
BigQueryは非常に便利なので強くオススメできるのですが、従量課金なので(=使った分だけお金がかかるので)間違えた設定で大量の請求がこないように注意して下さいね。
この記事を通して「ビッグクエリ」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータのプロ集団です。
データ分析に関わるコンサルティング/システム構築支援についてのお問い合わせはこちらから。

参照元

.https://thinkit.co.jp/story/2015/08/27/6346
.https://www.dsk-cloud.com/blog/what-is-google-bigquery
.https://www.buildinsider.net/web/bigquery/01
.https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
.https://cloud.google.com/bigquery?hl=ja
.https://www.topgate.co.jp/gcp12-how-to-analyze-big-data-with-bigquery
.https://www.ossnews.jp/oss_info/BigQuery
.https://beyondjapan.com/blog/2016/03/what-is-bigquery/
.https://manemichi.com/data-unit

データセット(Dataset)、データソース(Data Source)って何?前のページ

爆速データウェアハウスなApache Druidを試す次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    オンラインストレージ(Online Storage)って何?

    はじめにオンラインストレージとは字面の通り「オンライン上のストレージ…

  2. IT用語集

    GA(Google Analytics)とAA(Adobe Analytics)って何?

    はじめに現在のWEB解析ツールの代表例といえば、GA(Google …

  3. IT用語集

    シームレス(Seamless)って何?

    はじめにシームレスはIT業界だけでなく、日常会話でも非常によく使われ…

  4. IT用語集

    暗号化・共通鍵暗号・公開鍵暗号って何?

    はじめにほとんどの方が「暗号」という言葉を聞いたことはあると思います…

  5. IT用語集

    オーバーロード(Overload)って何?

    はじめにオーバーロード(過負荷)ってなかなか耳にしない単語ですよね。…

  6. IT用語集

    セッション(Session)って何?

    はじめにセッションとは「人が集まって作業を始め終了するまでの一連の区…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


カテゴリ
最近の記事
  1. Adobe Target Recommendations:g…
  2. Conversational Analytics APIでお…
  3. Looker Studioで日付フィルターの開始日・終了日の…
  4. Streamlitでdbt-elementary風ダッシュボ…
  5. Adobe WebSDK FPIDでECIDの復元を検証
  1. Python

    わかりやすいPyTorch入門②(ニューラルネットワークによる分類)
  2. IT用語集

    ファーストパーティー、セカンドパーティー、サードパーティデータって何?
  3. Adobe Analytics

    Adobe Analytics:ワークスペース:セグメント比較機能の紹介
  4. Adobe Analytics

    BigQuery: Adobe Datafeed: event_listカラムの…
  5. Adobe Experience Cloud

    Adobe Summit 2020レポート: Unravel Customer …
PAGE TOP