未分類

Databricksが買収した8080Labのbamboolibをひと足早く使って見る

こんにちは、エクスチュアの松村です。

先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。

8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。

というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。

bamboolibのサイトはこちら

Jupyter Notebookで使ってみましょう。

  1. Jupyter Notebookへのbamboolibのインストール

    bamboolibのインストールはpipを用いておこないます

    Jupyter Notebookは先にインストールしておきます

    pip install --upgrade bamboolib --user
    # Jupyter Notebook extensions
    python -m bamboolib install_nbextensions
    # JupyterLab extensions
    python -m bamboolib install_labextensions
  2. Jupyter Notebookを起動します

    jupyter notebook
  3. サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます


    bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
    こちらをクリックすると、bamboolibの編集モードになります

ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
An Interactive Data View:データのディメンションを見る

実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。

ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力

PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します

「Execute」をクリックすると、編集された結果が表示されます

この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。

作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。

 

  1. データフレームの探索

    bamboolibの「データフレーム探索」では、
    ・データの欠損
    ・各列の多変量の要約
    ・データ型に適用する2変量プロット

    ・列間の相関関係
    などをUIで見ることができます。

    UI上より「Explore DataFrame」をクリック

各種内容を見ることができます。

いかがでしたでしょうか。

簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。

 

databricksのnotebookを使ってみよう その2前のページ

Tableauのテスト自動化を実現する Wiiisdom Ops for Tableau次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. 未分類

    databricksのnotebookを使ってみよう その2

    こんにちは。エクスチュアの松村です。…

  2. Generative AI

    ChainlitでのOAuth認証にスコープを追加する方法

    こんにちは!ChainlitというPythonでチャットアプ…

  3. Data Clean Room

    SnowflakeのData Clean Roomを基礎から一番詳しく解説(2回目)

    こんにちは、喜田です。複雑なSnowflakeのデータクリー…

  4. Google Tag Manager

    【GA4/GTM】dataLayerを活用しよう

    はじめにこんにちは、エクスチュアの岩川です。GA4の…

  5. 未分類

    ThoughtSpotとSnowflakeを使ってセルフBIの世界を体験してみた

    こんにちは、エクスチュアの大崎と申します。BIツール使ってま…

  6. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について

    こんにちは、喜田です。本投稿は PostgreSQL Adv…

カテゴリ
最近の記事
  1. dbt Projects on Snowflake使ってみた…
  2. Cortex Analystを使ってみた
  3. SnowflakeのAI_SQLと再帰CTEで遊ぶ(Snow…
  4. dbt Fusion使ってみた
  5. Manusを使ってみたうえでManusに感想ブログを書かせて…
  1. Adobe Analytics

    Adobe AEP SDK: リバースプロキシを使ったアプリ計測検証方法
  2. Adobe Analytics

    Adobe Analytics: ランドスケイプの「企業ログ解析データベースAP…
  3. Google Tag Manager

    Google Tag Manager: 離脱リンクのクリックをトリガーにする
  4. Python

    わかりやすいPyTorch入門④(CNN:畳み込みニューラルネットワーク)
  5. IT用語集

    ウォームスタンバイ、コールドスタンバイ、ホットスタンバイって何?
PAGE TOP