未分類

Databricksが買収した8080Labのbamboolibをひと足早く使って見る

こんにちは、エクスチュアの松村です。

先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。

8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。

というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。

bamboolibのサイトはこちら

Jupyter Notebookで使ってみましょう。

  1. Jupyter Notebookへのbamboolibのインストール

    bamboolibのインストールはpipを用いておこないます

    Jupyter Notebookは先にインストールしておきます

    pip install --upgrade bamboolib --user
    # Jupyter Notebook extensions
    python -m bamboolib install_nbextensions
    # JupyterLab extensions
    python -m bamboolib install_labextensions
  2. Jupyter Notebookを起動します

    jupyter notebook
  3. サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます


    bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
    こちらをクリックすると、bamboolibの編集モードになります

ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
An Interactive Data View:データのディメンションを見る

実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。

ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力

PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します

「Execute」をクリックすると、編集された結果が表示されます

この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。

作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。

 

  1. データフレームの探索

    bamboolibの「データフレーム探索」では、
    ・データの欠損
    ・各列の多変量の要約
    ・データ型に適用する2変量プロット

    ・列間の相関関係
    などをUIで見ることができます。

    UI上より「Explore DataFrame」をクリック

各種内容を見ることができます。

いかがでしたでしょうか。

簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。

 

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Google Tag Manager

    【GA4/GTM】dataLayerを活用しよう

    はじめにこんにちは、エクスチュアの岩川です。GA4の…

  2. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について

    こんにちは、喜田です。本投稿は PostgreSQL Adv…

  3. Google BigQuery

    【BigQuery】TABLESAMPLE SYSTEMを日本一詳しく解説する

    1. はじめにこんにちは、エクスチュアの大崎です。…

  4. Mouseflow

    mouseflow の フリクションイベント って何?

    Webサイトの訪問者は、様々な理由でコンバージョン[閲覧者による収益…

  5. Office365

    エクセルで「テーブル」を使うメリット① 「BIツールで使いやすい」

    データを扱ういろんな環境、ツールがありますが、今も現場で出番の多いエ…

  6. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

最近の記事

  1. LangChainって何?: 次世代AIアプリケーション構築…
  2. 回帰分析はかく語りき Part1 単回帰分析
  3. GitHub ActionsでGCEへのデプロイを楽にしてみ…
  4. Snowflake の Copilot が優秀すぎる件につい…
  5. Snowflake の新しいData Clean Roomの…
  1. Adobe Analytics

    Adobe AEP SDKをTypeScriptで開発したReactNative…
  2. Tableau

    Tableauで複数のチャートを1シート内で表示する『パネルチャート』の作り方
  3. IT用語集

    キャッシュ(Cache)って何?
  4. ブログ

    FABフレームワークで「缶コーヒー」をビジネスマンに売る
  5. IT用語集

    コード、コンパイル、ソースコードって何?
PAGE TOP