IT用語集

ビッグクエリ(Big Query)って何?

はじめに

「ビッククエリ = ビッグ + クエリ = 大きい + クエリ!?」と思われた方、お疲れ様です。
内容とは関係ないのですが、ビッククエリって本当に発音しづらいですよね。。
私(ヨナハ)だけかもしれないのですが、発音の際にいつも「ビククエリ」と言ってしまいます。(本当に言いにくい
さて冗談はこの辺にして、ビッグクエリの意味と使われ方について早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

ビッグクエリ(Big Query)・・・Googleがクラウドで提供するDWH。数TBのデータでも数秒〜数十秒程度で結果を返すことができる優れもの。

ビッグクエリとは

ビッグクエリとは「数十億行のデータの処理を”超”高速(数秒〜数十秒)で処理できる格安サービス」です。
速いことは理解していただけたと思うのですが、どれほど安いのかが気になりますよね。
なんと、クエリ料金は毎月「1TB(テラバイト) = 約500円」です。(安い
また、データの保存に関しては毎月「1TB(テラバイト) = 約2000円」です。(安い
「1TB = 1000GB」なので、私たちがスマホの通信制限で苦しんでいる毎月「8GB」というデータ量に比べたらどれだけ大きく、どれだけ安いのかということがわかります。
ビッグクエリの高速で格安なサービスを実現する仕組みは大きく2つあります。
①カラム構造データストア(=列毎に分割してデータを保存)
従来のデータベースシステムではデータを行単位で保存して処理を行うのですが、ビッグクエリでは「列単位でまとめてデータを保存」することでデータの運搬効率/圧縮性を上げることを可能にしています。(正確な仕組みはもっと複雑なのでここでは割愛)
②ツリーアーキテクチャー
ツリー式で処理を分散させることで「データの並列処理」を可能にし、その結果を高速に集約することでクエリの結果を出しています。
これら2つの技術はGoogle独自のものというわけではないですが「既存のGoogleのクラウド技術との相性」や「高性能な仕組みを格安で提供している」という点がビッグクエリが支持されている理由です。
他にも「データの暗号化と複製が自動で行われ安全性が高い」「アクセス権の管理が楽」「TableauGoogle Analyticsなど様々な製品と相性が良い」「自動でクエリを回すことができる」などなど多くの強みがあります。
私(ヨナハ)も、実際にTableau×Big Queryでデータの更新〜集計〜可視化というプロセスを全て自動化しています。
SQLがある程度かけてTableau Server/Onlineが使えればできるのでオススメです。

おわりに

いかがでしたか。
BigQueryは非常に便利なので強くオススメできるのですが、従量課金なので(=使った分だけお金がかかるので)間違えた設定で大量の請求がこないように注意して下さいね。
この記事を通して「ビッグクエリ」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータのプロ集団です。
データ分析に関わるコンサルティング/システム構築支援についてのお問い合わせはこちらから。

参照元

.https://thinkit.co.jp/story/2015/08/27/6346
.https://www.dsk-cloud.com/blog/what-is-google-bigquery
.https://www.buildinsider.net/web/bigquery/01
.https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
.https://cloud.google.com/bigquery?hl=ja
.https://www.topgate.co.jp/gcp12-how-to-analyze-big-data-with-bigquery
.https://www.ossnews.jp/oss_info/BigQuery
.https://beyondjapan.com/blog/2016/03/what-is-bigquery/
.https://manemichi.com/data-unit

データセット(Dataset)、データソース(Data Source)って何?前のページ

爆速データウェアハウスなApache Druidを試す次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    シンクライアント(Thin Client)って何?

    はじめにシンクライアントとは、新クラアントのことではありません。シ…

  2. IT用語集

    キャッシュ(Cache)って何?

    はじめに今回紹介するキャッシュ(Cache)は、現金という意味の英単…

  3. IT用語集

    メモリ(Memory)、仮想メモリ(Virtual Memory)って何?

    はじめに仮想メモリとは、自身の能力を超えて仮想的な記憶力を得ることで…

  4. IT用語集

    グループウェア(Groupware)って何?

    はじめに「〇〇ware」という言葉は、〇〇用/製のものという意味を持…

  5. IT用語集

    コンソール(Console)って何?

    はじめに今日はあまり馴染みのない「コンソール」という単語について紹介…

  6. IT用語集

    クロスデバイス(Cross Device)って何?

    はじめにクロスデバイスとは、文字通り「デバイス(スマホやパソコンなど…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


カテゴリ
最近の記事
  1. 【dbts25】Snowflake×PostgreSQLのニ…
  2. TROCCO dbt連携編
  3. KARTEの「フレックスエディタ(β)」登場!ノーコードでこ…
  4. dbt Projects on Snowflake使ってみた…
  5. Cortex Analystを使ってみた
  1. Google Apps Script(GAS)

    Google App ScriptとGoogleスプレッドシートを連携させる
  2. ヒートマップ

    【Tips】ヒートマップ機能について①~クリック・スクロール編~
  3. Excel

    コホート分析(Cohort Analysis)って何?〜Tableau/GA/E…
  4. ObservePoint

    タグ監査ツールとは? 〜〜出来ることと導入のメリット〜〜
  5. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について
PAGE TOP