未分類

Databricksが買収した8080Labのbamboolibをひと足早く使って見る

こんにちは、エクスチュアの松村です。

先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。

8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。

というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。

bamboolibのサイトはこちら

Jupyter Notebookで使ってみましょう。

  1. Jupyter Notebookへのbamboolibのインストール

    bamboolibのインストールはpipを用いておこないます

    Jupyter Notebookは先にインストールしておきます

    pip install --upgrade bamboolib --user
    # Jupyter Notebook extensions
    python -m bamboolib install_nbextensions
    # JupyterLab extensions
    python -m bamboolib install_labextensions
  2. Jupyter Notebookを起動します

    jupyter notebook
  3. サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます


    bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
    こちらをクリックすると、bamboolibの編集モードになります

ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
An Interactive Data View:データのディメンションを見る

実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。

ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力

PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します

「Execute」をクリックすると、編集された結果が表示されます

この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。

作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。

 

  1. データフレームの探索

    bamboolibの「データフレーム探索」では、
    ・データの欠損
    ・各列の多変量の要約
    ・データ型に適用する2変量プロット

    ・列間の相関関係
    などをUIで見ることができます。

    UI上より「Explore DataFrame」をクリック

各種内容を見ることができます。

いかがでしたでしょうか。

簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。

 

databricksのnotebookを使ってみよう その2前のページ

Tableauのテスト自動化を実現する Wiiisdom Ops for Tableau次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Cortex

    [Snowflake新機能]AI_AGGを試してみた

    この記事はSnowflake Summit 2025で発表されたAI…

  2. 未分類

    databricksのnotebookを使ってみよう その2

    こんにちは。エクスチュアの松村です。…

  3. データサイエンス

    回帰分析はかく語りき Part3 ロジスティック回帰

    こんにちは、小郷です。昨今は社会が複雑化したために、Yes…

  4. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

  5. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について

    こんにちは、喜田です。本投稿は PostgreSQL Adv…

  6. Mouseflow

    mouseflow の フリクションイベント って何?

    Webサイトの訪問者は、様々な理由でコンバージョン[閲覧者による収益…

カテゴリ
最近の記事
  1. dbt Fusion使ってみた
  2. Manusを使ってみたうえでManusに感想ブログを書かせて…
  3. SquadbaseとStreamlitでお手軽アプリ開発
  4. [Snowflake Summit 2025] Snowfl…
  5. [Snowflake新機能]AI_AGGを試してみた
  1. Python

    わかりやすいPyTorch入門⑤(CNNとデータの拡張)
  2. Adobe Analytics

    Adobe Analytics: データフィードをBigQueryで集計する
  3. Mouseflow

    ヒートマップ活用法
  4. GA 360 Suite

    GoogleDataStudio:複数のデータソースにフィルターを適用する
  5. Tableau

    動的なリファレンスラインで個別に閾値(しきい値)を設定【Tableau】
PAGE TOP