IT用語集

ビッグクエリ(BigQuery)って何?

はじめに

「ビッククエリ = ビッグ + クエリ = 大きい + クエリ!?」と思われた方、お疲れ様です。
内容とは関係ないのですが、ビッククエリって本当に発音しづらいですよね。。
私(ヨナハ)だけかもしれないのですが、発音の際にいつも「ビククエリ」と言ってしまいます。(本当に言いにくい
さて冗談はこの辺にして、ビッグクエリの意味と使われ方について早速みていきましょー!!✨

用語説明〜最速で理解したい人のためのIT用語集より抜粋〜

ビッグクエリ(BigQuery)・・・Googleがクラウドで提供するDWH。数TBのデータでも数秒〜数十秒程度で結果を返すことができる優れもの。

ビッグクエリとは

ビッグクエリとは「数十億行のデータの処理を”超”高速(数秒〜数十秒)で処理できる格安サービス」です。
速いことは理解していただけたと思うのですが、どれほど安いのかが気になりますよね。
なんと、クエリ料金は毎月「1TB(テラバイト) = 約500円」です。(安い
また、データの保存に関しては毎月「1TB(テラバイト) = 約2000円」です。(安い
「1TB = 1000GB」なので、私たちがスマホの通信制限で苦しんでいる毎月「8GB」というデータ量に比べたらどれだけ大きく、どれだけ安いのかということがわかります。
ビッグクエリの高速で格安なサービスを実現する仕組みは大きく2つあります。
①カラム構造データストア(=列毎に分割してデータを保存)
従来のデータベースシステムではデータを行単位で保存して処理を行うのですが、ビッグクエリでは「列単位でまとめてデータを保存」することでデータの運搬効率/圧縮性を上げることを可能にしています。(正確な仕組みはもっと複雑なのでここでは割愛)
②ツリーアーキテクチャー
ツリー式で処理を分散させることで「データの並列処理」を可能にし、その結果を高速に集約することでクエリの結果を出しています。
これら2つの技術はGoogle独自のものというわけではないですが「既存のGoogleのクラウド技術との相性」や「高性能な仕組みを格安で提供している」という点がビッグクエリが支持されている理由です。
他にも「データの暗号化と複製が自動で行われ安全性が高い」「アクセス権の管理が楽」「TableauGoogle Analyticsなど様々な製品と相性が良い」「自動でクエリを回すことができる」などなど多くの強みがあります。
私(ヨナハ)も、実際にTableau×Big Queryでデータの更新〜集計〜可視化というプロセスを全て自動化しています。
SQLがある程度かけてTableau Server/Onlineが使えればできるのでオススメです。

おわりに

いかがでしたか。
BigQueryは非常に便利なので強くオススメできるのですが、従量課金なので(=使った分だけお金がかかるので)間違えた設定で大量の請求がこないように注意して下さいね。
この記事を通して「ビッグクエリ」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇‍♂️
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータのプロ集団です。
データ分析に関わるコンサルティング/システム構築支援についてのお問い合わせはこちらから。

参照元

.https://thinkit.co.jp/story/2015/08/27/6346
.https://www.dsk-cloud.com/blog/what-is-google-bigquery
.https://www.buildinsider.net/web/bigquery/01
.https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
.https://cloud.google.com/bigquery?hl=ja
.https://www.topgate.co.jp/gcp12-how-to-analyze-big-data-with-bigquery
.https://www.ossnews.jp/oss_info/BigQuery
.https://beyondjapan.com/blog/2016/03/what-is-bigquery/
.https://manemichi.com/data-unit

データセット(Dataset)、データソース(Data Source)って何?前のページ

爆速データウェアハウスなApache Druidを試す次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. IT用語集

    レンダリング(Rendering)って何?

    はじめにレンダー(render)は「元に戻す」という意味の英単語です…

  2. IT用語集

    シェル(Shell)って何?

    はじめにシェルとは"貝殻"を意味する英単語です。では、ITの世界で…

  3. IT用語集

    クラスタ(Cluster)・クラスタリング(Clustering)って何?

    はじめにクラスタって上級者がたまに会話で使ってますよね。お仕事で分…

  4. IT用語集

    パス、絶対パス、相対パス、ルートパスって何?

    はじめにパスとは簡単にいうと「特定ファイルが置いてある場所」のことで…

  5. IT用語集

    オンデマンド(On Demand)って何?

    はじめにオンデマンド配信、オンデマンド授業。最近ではリモート環境で…

  6. IT用語集

    データセット(Dataset)、データソース(Data Source)って何?

    はじめに「データセット」と「データソース」ってもう名前から想像しやす…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


カテゴリ
最近の記事
  1. モック作成が面倒で “楽” した話
  2. Fivetranからdbtプロジェクトを実行する
  3. Account Engagementで送るメールをマルチエー…
  4. 協力と裏切りの理論
  5. 【Snowflake Tips】Content-Typeには…
  1. Python

    モダンデータスタックなワークフローオーケストレーションツール「Prefect」 …
  2. IT用語集

    アプライアンス(Appliance)って何?
  3. Tableau

    Tableauで見たい期間のみの昨年対比推移グラフを作る方法
  4. Adobe Analytics

    Adobe Analyticsに入り切らないデータをBigQueryに投入する
  5. 未分類

    Databricksが買収した8080Labのbamboolibをひと足早く使っ…
PAGE TOP