未分類

databricksのnotebookを使ってみよう その2

 

こんにちは。エクスチュアの松村です。

あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます

前回の記事はこちら

今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。

3.複数人で同じノートブックへの同時編集、コメント

Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。

また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。

これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。

4.ロギング 変更履歴の自動保存

Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。

右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。

 

5.ノートブックをスケジュールジョブとして実行

機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。

Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。

またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。

 

いかがでしたでしょうか。

弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です

ブログへの記事リクエストはこちらまでどうぞ。

databricksのnotebookを使ってみよう その1前のページ

Databricksが買収した8080Labのbamboolibをひと足早く使って見る次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Google Tag Manager

    【GA4/GTM】dataLayerを活用しよう

    はじめにこんにちは、エクスチュアの岩川です。GA4の…

  2. Mouseflow

    mouseflow の フリクションイベント って何?

    Webサイトの訪問者は、様々な理由でコンバージョン[閲覧者による収益…

  3. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について

    こんにちは、喜田です。本投稿は PostgreSQL Adv…

  4. Office365

    エクセルで「テーブル」を使うメリット① 「BIツールで使いやすい」

    データを扱ういろんな環境、ツールがありますが、今も現場で出番の多いエ…

  5. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

  6. Data Clean Room

    SnowflakeのData Clean Roomを基礎から一番詳しく解説(2回目)

    こんにちは、喜田です。複雑なSnowflakeのデータクリー…

カテゴリ
最近の記事
  1. Adobe WebSDK FPIDでECIDの復元を検証
  2. dbt Projects on Snowflakeで作成した…
  3. Dataformでtype:’increment…
  4. dbt Projects on SnowflakeをTASK…
  5. AWS発のAIエージェントIDE「Kiro」を使用した仕様駆…
  1. 海外カンファレンス

    Tableauカンファレンスレポート
  2. Tableau

    TableauでTreasure Data上のデータへ接続する方法(2019/1…
  3. Databricks

    ScalaでDatabricksのDataFrameを扱う
  4. Adobe Analytics

    Adobe Analytics + Google BigQueryでよく使うSQ…
  5. Python

    わかりやすいPyTorch入門④(CNN:畳み込みニューラルネットワーク)
PAGE TOP