こんにちは、エクスチュアの松村です。
先日、Databricks社がローコード/ノーコード開発企業の8080 Labsを買収したニュースが伝えられました。
ローコード/ノーコード 便利ですね。
8080LabsのbamboolabはUIベースのデータサイエンスツールであり、コードを使用せず、数回のクリックですばやく簡単にデータの探索や変換を行うことができます。
というもののようなのですが、あまり馴染みがなかったのでDatabricksに統合される前にひと足早く使ってみました。Free版です。
bamboolibのサイトはこちら
Jupyter Notebookで使ってみましょう。
-
Jupyter Notebookへのbamboolibのインストール
bamboolibのインストールはpipを用いておこないます
Jupyter Notebookは先にインストールしておきます
pip install --upgrade bamboolib --user # Jupyter Notebook extensions python -m bamboolib install_nbextensions # JupyterLab extensions python -m bamboolib install_labextensions
-
Jupyter Notebookを起動します
jupyter notebook
-
サンプルとして、よく使われるTitanicのデータをDataframeとしてPandasに読み込みます
bamboolibがインストールされていると、Dataframeの表示と共に「Show bamboolib UI」のボタンがあらわれます。
こちらをクリックすると、bamboolibの編集モードになります
ここからがbamboolibの本領発揮です。Dataframeの操作をUIで実施していきます。
UIは3つのコンポーネントでなりたっています。
・Global controls: データの編集、元に戻す、やり直し、コードのエクスポート
・DataFrame actions: データ変換を実行し、探索する
・An Interactive Data View:データのディメンションを見る
実際に操作をしてみます。
データの編集では、GroupBy、Filter、Sort、JOINなどPandasでコードを記述して実行する内容のほとんどがUI上で実行できます。
ここでは年齢が乗客のクラスと性別ごとにどのように大まかに分布しているかを確認するため、GroupByを用いてでデータをみてみましょう。
キーボードでワードを入れるとサジェストされるので、GroupByを入力
PclassとSexでGroupBy、AgeのMin・Max・Meanを出します
「New dataframe name」を指定すると、編集結果を新しいDataFrameに出力します
「Execute」をクリックすると、編集された結果が表示されます
この結果をグラフにしてみましょう。
「Create Plot」をクリックすると、UIでグラフを作ることができます。
作成したグラフに対して、コード化もされます。このコードをコピーしておけば、どこでも再現可能です。
-
データフレームの探索
bamboolibの「データフレーム探索」では、
・データの欠損
・各列の多変量の要約
・データ型に適用する2変量プロット
・列間の相関関係
などをUIで見ることができます。UI上より「Explore DataFrame」をクリック
各種内容を見ることができます。
いかがでしたでしょうか。
簡単にしか触っていませんが、普段コードを書いてデータを見ていることがUI上でとても簡単にできるようになっています。
Jupyter NotebookでPandasを使っているのであれば、すぐにでも使って見るとよいですね。
Databricksへの統合が楽しみです。