こんにちは。エクスチュアの松村です。
あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます
前回の記事はこちら
今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。
3.複数人で同じノートブックへの同時編集、コメント
Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。
また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。
これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。
4.ロギング 変更履歴の自動保存
Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。
右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。
5.ノートブックをスケジュールジョブとして実行
機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。
Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。
またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。
いかがでしたでしょうか。
弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です
ブログへの記事リクエストはこちらまでどうぞ。