未分類

databricksのnotebookを使ってみよう その2

 

こんにちは。エクスチュアの松村です。

あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます

前回の記事はこちら

今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。

3.複数人で同じノートブックへの同時編集、コメント

Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。

また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。

これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。

4.ロギング 変更履歴の自動保存

Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。

右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。

 

5.ノートブックをスケジュールジョブとして実行

機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。

Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。

またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。

 

いかがでしたでしょうか。

弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です

ブログへの記事リクエストはこちらまでどうぞ。

関連記事

  1. 未分類

    Databricksが買収した8080Labのbamboolibをひと足早く使って見る

    こんにちは、エクスチュアの松村です。先日、Databricks…

最近の記事

  1. System Managerを利用したVPC内Redshif…
  2. Amazon Redshift ビルド168まとめ
  3. Tableauのテスト自動化を実現する Wiiisdom O…
  4. Databricksが買収した8080Labのbambool…
  5. databricksのnotebookを使ってみよう その2…
  1. Adobe Experience Cloud

    Adobe Summit 2020レポート: 5 Marketing Trend…
  2. Firebase Analytics

    Firebase AnalyticsのデータをフラットなCSVに変換するETL処…
  3. GA 360 Suite

    GoogleDataStudio:複数のデータソースにフィルターを適用する
  4. Adobe Cloud Platform Auditor

    Adobe Cloud Platform Auditor (Powered by…
  5. Google Analytics

    Cloud FunctionsとOpenWeather APIを使ってGoogl…
PAGE TOP