未分類

Databricksが買収した8080Labのbamboolibをひと足早く使って見る

こんにちは、エクスチュアの松村です。

先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。

8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。

というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。

bamboolibのサイトはこちら

Jupyter Notebookで使ってみましょう。

  1. Jupyter Notebookへのbamboolibのインストール

    bamboolibのインストールはpipを用いておこないます

    Jupyter Notebookは先にインストールしておきます

    pip install --upgrade bamboolib --user
    # Jupyter Notebook extensions
    python -m bamboolib install_nbextensions
    # JupyterLab extensions
    python -m bamboolib install_labextensions
  2. Jupyter Notebookを起動します

    jupyter notebook
  3. サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます


    bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
    こちらをクリックすると、bamboolibの編集モードになります

ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
An Interactive Data View:データのディメンションを見る

実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。

ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力

PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します

「Execute」をクリックすると、編集された結果が表示されます

この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。

作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。

 

  1. データフレームの探索

    bamboolibの「データフレーム探索」では、
    ・データの欠損
    ・各列の多変量の要約
    ・データ型に適用する2変量プロット

    ・列間の相関関係
    などをUIで見ることができます。

    UI上より「Explore DataFrame」をクリック

各種内容を見ることができます。

いかがでしたでしょうか。

簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。

 

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Google BigQuery

    【BigQuery】TABLESAMPLE SYSTEMを日本一詳しく解説する

    1. はじめにこんにちは、エクスチュアの大崎です。…

  2. KARTE

    KARTE 成果の出るアイデアを考える_ツールを活用できていないと感じたら

    エクスチュアの林です。今回はKARTEを活用していらっしゃる…

  3. Office365

    エクセルで「テーブル」を使うメリット① 「BIツールで使いやすい」

    データを扱ういろんな環境、ツールがありますが、今も現場で出番の多いエ…

  4. 未分類

    databricksのnotebookを使ってみよう その2

    こんにちは。エクスチュアの松村です。…

  5. 未分類

    ThoughtSpotとSnowflakeを使ってセルフBIの世界を体験してみた

    こんにちは、エクスチュアの大崎と申します。BIツール使ってま…

  6. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

カテゴリ

最近の記事

  1. 進化学に倣う最適化手法「遺伝的アルゴリズム」
  2. dbt_expectationsでデータ品質を向上させよう
  3. BigQueryとSnowflakeのLLM関数を比較してみ…
  4. dbtCloud使ってみた
  5. ChainlitでのOAuth認証にスコープを追加する方法
  1. Adobe Analytics

    【超わかる】WEB解析の全貌
  2. Cloud Dataflow

    データアナリスト/データエンジニア向けNext19まとめ
  3. マーケティング

    ジャーニーマップをデジタルマーケティングの視点で
  4. Adobe Cloud Platform Auditor

    AdobeSummit 2020レポート: “Connecting Experi…
  5. IT用語集

    アドイン(Add In)・アドオン(Add On)って何?
PAGE TOP