はじめに
「ビッククエリ = ビッグ + クエリ = 大きい + クエリ!?」と思われた方、お疲れ様です。
内容とは関係ないのですが、ビッククエリって本当に発音しづらいですよね。。
私(ヨナハ)だけかもしれないのですが、発音の際にいつも「ビククエリ」と言ってしまいます。(本当に言いにくい
さて冗談はこの辺にして、ビッグクエリの意味と使われ方について早速みていきましょー!!✨
用語説明〜最速で理解したい人のためのIT用語集より抜粋〜
ビッグクエリ(Big Query)・・・Googleがクラウドで提供するDWH。数TBのデータでも数秒〜数十秒程度で結果を返すことができる優れもの。
ビッグクエリとは
ビッグクエリとは「数十億行のデータの処理を”超”高速(数秒〜数十秒)で処理できる格安サービス」です。
速いことは理解していただけたと思うのですが、どれほど安いのかが気になりますよね。
なんと、クエリ料金は毎月「1TB(テラバイト) = 約500円」です。(安い
また、データの保存に関しては毎月「1TB(テラバイト) = 約2000円」です。(安い
「1TB = 1000GB」なので、私たちがスマホの通信制限で苦しんでいる毎月「8GB」というデータ量に比べたらどれだけ大きく、どれだけ安いのかということがわかります。
ビッグクエリの高速で格安なサービスを実現する仕組みは大きく2つあります。
①カラム構造データストア(=列毎に分割してデータを保存)
従来のデータベースシステムではデータを行単位で保存して処理を行うのですが、ビッグクエリでは「列単位でまとめてデータを保存」することでデータの運搬効率/圧縮性を上げることを可能にしています。(正確な仕組みはもっと複雑なのでここでは割愛)
②ツリーアーキテクチャー
ツリー式で処理を分散させることで「データの並列処理」を可能にし、その結果を高速に集約することでクエリの結果を出しています。
これら2つの技術はGoogle独自のものというわけではないですが「既存のGoogleのクラウド技術との相性」や「高性能な仕組みを格安で提供している」という点がビッグクエリが支持されている理由です。
他にも「データの暗号化と複製が自動で行われ安全性が高い」「アクセス権の管理が楽」「TableauやGoogle Analyticsなど様々な製品と相性が良い」「自動でクエリを回すことができる」などなど多くの強みがあります。
私(ヨナハ)も、実際にTableau×Big Queryでデータの更新〜集計〜可視化というプロセスを全て自動化しています。
SQLがある程度かけてTableau Server/Onlineが使えればできるのでオススメです。
おわりに
いかがでしたか。
BigQueryは非常に便利なので強くオススメできるのですが、従量課金なので(=使った分だけお金がかかるので)間違えた設定で大量の請求がこないように注意して下さいね。
この記事を通して「ビッグクエリ」に関する理解を深めていただければ幸いです。
最後まで目を通していただきありがとうございました🙇♂️
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータのプロ集団です。
データ分析に関わるコンサルティング/システム構築支援についてのお問い合わせはこちらから。
参照元
.https://thinkit.co.jp/story/2015/08/27/6346
.https://www.dsk-cloud.com/blog/what-is-google-bigquery
.https://www.buildinsider.net/web/bigquery/01
.https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
.https://cloud.google.com/bigquery?hl=ja
.https://www.topgate.co.jp/gcp12-how-to-analyze-big-data-with-bigquery
.https://www.ossnews.jp/oss_info/BigQuery
.https://beyondjapan.com/blog/2016/03/what-is-bigquery/
.https://manemichi.com/data-unit
この記事へのコメントはありません。