IT用語集

ビッグクエリ(Big Query)って何?

はじめに

「ビッククエリ = ビッグ + クエリ = 大きい + クエリ!?」と思われた方、お疲れ様です。
内容とは関係ないのですが、ビッククエリって本当に発音しづらいですよね。。
私(ヨナハ)だけかもしれないのですが、発音の際にいつも「ビククエリ」と言ってしまいます。(本当に言いにくい
さて冗談はこの辺にして、ビッグクエリの意味と使われ方について早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

ビッグクエリ(Big Query)・・・Googleがクラウドで提供するDWH。数TBのデータでも数秒〜数十秒程度で結果を返すことができる優れもの。

ビッグクエリとは

ビッグクエリとは「数十億行のデータの処理を”超”高速(数秒〜数十秒)で処理できる格安サービス」です。
速いことは理解していただけたと思うのですが、どれほど安いのかが気になりますよね。
なんと、クエリ料金は毎月「1TB(テラバイト) = 約500円」です。(安い
また、データの保存に関しては毎月「1TB(テラバイト) = 約2000円」です。(安い
「1TB = 1000GB」なので、私たちがスマホの通信制限で苦しんでいる毎月「8GB」というデータ量に比べたらどれだけ大きく、どれだけ安いのかということがわかります。
ビッグクエリの高速で格安なサービスを実現する仕組みは大きく2つあります。
①カラム構造データストア(=列毎に分割してデータを保存)
従来のデータベースシステムではデータを行単位で保存して処理を行うのですが、ビッグクエリでは「列単位でまとめてデータを保存」することでデータの運搬効率/圧縮性を上げることを可能にしています。(正確な仕組みはもっと複雑なのでここでは割愛)
②ツリーアーキテクチャー
ツリー式で処理を分散させることで「データの並列処理」を可能にし、その結果を高速に集約することでクエリの結果を出しています。
これら2つの技術はGoogle独自のものというわけではないですが「既存のGoogleのクラウド技術との相性」や「高性能な仕組みを格安で提供している」という点がビッグクエリが支持されている理由です。
他にも「データの暗号化と複製が自動で行われ安全性が高い」「アクセス権の管理が楽」「TableauGoogle Analyticsなど様々な製品と相性が良い」「自動でクエリを回すことができる」などなど多くの強みがあります。
私(ヨナハ)も、実際にTableau×Big Queryでデータの更新〜集計〜可視化というプロセスを全て自動化しています。
SQLがある程度かけてTableau Server/Onlineが使えればできるのでオススメです。

おわりに

いかがでしたか。
BigQueryは非常に便利なので強くオススメできるのですが、従量課金なので(=使った分だけお金がかかるので)間違えた設定で大量の請求がこないように注意して下さいね。
この記事を通して「ビッグクエリ」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータのプロ集団です。
データ分析に関わるコンサルティング/システム構築支援についてのお問い合わせはこちらから。

参照元

.https://thinkit.co.jp/story/2015/08/27/6346
.https://www.dsk-cloud.com/blog/what-is-google-bigquery
.https://www.buildinsider.net/web/bigquery/01
.https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
.https://cloud.google.com/bigquery?hl=ja
.https://www.topgate.co.jp/gcp12-how-to-analyze-big-data-with-bigquery
.https://www.ossnews.jp/oss_info/BigQuery
.https://beyondjapan.com/blog/2016/03/what-is-bigquery/
.https://manemichi.com/data-unit

データセット(Dataset)、データソース(Data Source)って何?前のページ

爆速データウェアハウスなApache Druidを試す次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    デバッグ(Debug)、デバッガ(Debugger)って何?

    はじめにプログラミングの勉強をする際に、必ずと言っていいほど出てくる…

  2. IT用語集

    オンデマンド(On Demand)って何?

    はじめにオンデマンド配信、オンデマンド授業。最近ではリモート環境で…

  3. IT用語集

    オプティマイズ(Optimize)って何?

    はじめに"オプティマイズ"ってなかなかキレイに発音できないですよね。…

  4. IT用語集

    仮想化(Virtualization)って何?

    はじめにわかりそうでよくわからない「仮想化」という言葉。実は仮想化…

  5. IT用語集

    アプライアンス(Appliance)って何?

    はじめにアプライアンスという言葉を耳にしたことはありますか?家電量…

  6. IT用語集

    ドキュメント(Document)って何?

    はじめにドキュメントって何だろう、周りでこの言葉を使う人が増えたなぁ…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


カテゴリ
最近の記事
  1. Looker Studioで日付フィルターの開始日・終了日の…
  2. Streamlitでdbt-elementary風ダッシュボ…
  3. Adobe WebSDK FPIDでECIDの復元を検証
  4. dbt Projects on Snowflakeで作成した…
  5. Dataformでtype:’increment…
  1. ブログ

    ⑥DMPについてー日本に進出していないDMP
  2. Adobe Analytics

    Looker: エンジニアがBIで分析ダッシュボードを作る
  3. IT用語集

    データセット(Dataset)、データソース(Data Source)って何?
  4. Tableau

    Tableau Tips〜WINDOW関数〜
  5. Google Analytics

    Google Analytics 4 + BigQueryでよく使う基本的なSQ…
PAGE TOP