未分類

Databricksが買収した8080Labのbamboolibをひと足早く使って見る

こんにちは、エクスチュアの松村です。

先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。

8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。

というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。

bamboolibのサイトはこちら

Jupyter Notebookで使ってみましょう。

  1. Jupyter Notebookへのbamboolibのインストール

    bamboolibのインストールはpipを用いておこないます

    Jupyter Notebookは先にインストールしておきます

    pip install --upgrade bamboolib --user
    # Jupyter Notebook extensions
    python -m bamboolib install_nbextensions
    # JupyterLab extensions
    python -m bamboolib install_labextensions
  2. Jupyter Notebookを起動します

    jupyter notebook
  3. サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます


    bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
    こちらをクリックすると、bamboolibの編集モードになります

ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
An Interactive Data View:データのディメンションを見る

実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。

ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力

PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します

「Execute」をクリックすると、編集された結果が表示されます

この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。

作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。

 

  1. データフレームの探索

    bamboolibの「データフレーム探索」では、
    ・データの欠損
    ・各列の多変量の要約
    ・データ型に適用する2変量プロット

    ・列間の相関関係
    などをUIで見ることができます。

    UI上より「Explore DataFrame」をクリック

各種内容を見ることができます。

いかがでしたでしょうか。

簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。

 

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. 未分類

    1st Party Cookieと3rd Party Cookieの違いと昨今の問題点をざっくり解説…

    はじめに昨今のデジマ業界において扱いが難しくなっているCoo…

  2. Office365

    エクセルで「テーブル」を使うメリット① 「BIツールで使いやすい」

    データを扱ういろんな環境、ツールがありますが、今も現場で出番の多いエ…

  3. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

  4. 未分類

    ThoughtSpotとSnowflakeを使ってセルフBIの世界を体験してみた

    こんにちは、エクスチュアの大崎と申します。BIツール使ってま…

  5. Google BigQuery

    【BigQuery】TABLESAMPLE SYSTEMを日本一詳しく解説する

    1. はじめにこんにちは、エクスチュアの大崎です。…

  6. 未分類

    databricksのnotebookを使ってみよう その2

    こんにちは。エクスチュアの松村です。…

最近の記事

  1. 【GA4/GTM】dataLayerを使ってカスタムイベント…
  2. KARTE を使ってサイト外でも接客を
  3. 【GA4/GTM】dataLayerを活用しよう
  4. ジャーニーマップをデジタルマーケティングの視点で
  5. ChatGPT ProからClaude3 Proへ移行した話…
  1. Adobe Analytics

    Adobe Analytics: データフィードをGoogle BigQuery…
  2. DBエンジニアが学ぶSnowflake

    【DBエンジニアが語るSnowflake】②このロールがすごい!!!
  3. IT用語集

    ゴー言語(Golang)って何?
  4. IT用語集

    暗号化・共通鍵暗号・公開鍵暗号って何?
  5. Databricks

    Databricks: Spark RDDで使う主なメソッド
PAGE TOP