未分類

databricksのnotebookを使ってみよう その2

 

こんにちは。エクスチュアの松村です。

あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます

前回の記事はこちら

今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。

3.複数人で同じノートブックへの同時編集、コメント

Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。

また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。

これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。

4.ロギング 変更履歴の自動保存

Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。

右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。

 

5.ノートブックをスケジュールジョブとして実行

機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。

Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。

またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。

 

いかがでしたでしょうか。

弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です

ブログへの記事リクエストはこちらまでどうぞ。

databricksのnotebookを使ってみよう その1前のページ

Databricksが買収した8080Labのbamboolibをひと足早く使って見る次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. Cortex

    [Snowflake新機能]AI_AGGを試してみた

    この記事はSnowflake Summit 2025で発表されたAI…

  2. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

  3. 未分類

    Databricksが買収した8080Labのbamboolibをひと足早く使って見る

    こんにちは、エクスチュアの松村です。先日、Databricks…

  4. データサイエンス

    回帰分析はかく語りき Part3 ロジスティック回帰

    こんにちは、小郷です。昨今は社会が複雑化したために、Yes…

  5. Data Clean Room

    SnowflakeのData Clean Roomを基礎から一番詳しく解説(2回目)

    こんにちは、喜田です。複雑なSnowflakeのデータクリー…

  6. Office365

    エクセルで「テーブル」を使うメリット① 「BIツールで使いやすい」

    データを扱ういろんな環境、ツールがありますが、今も現場で出番の多いエ…

カテゴリ
最近の記事
  1. 【Snowflake Tips】Content-Typeには…
  2. データ連携を自動化!Fivetranの概要・料金とスプレッド…
  3. Adobe WebSDK クロスドメイン計測【第2部】FPI…
  4. Adobe WebSDK クロスドメイン計測【第1部】ECI…
  5. Adobe Target Recommendations:g…
  1. Tableau

    Tableauのモデリング関数を理解する
  2. Snowflake

    [Snowflake Summit 2025] Snowflake Postgr…
  3. Data Clean Room

    Snowflake の新しいData Clean Roomの見どころを解説
  4. ChatGPT

    LangChainのソースコードから実装を見てみる(ChatModelのinvo…
  5. Python

    モダンデータスタックなワークフローオーケストレーションツール「Prefect」 …
PAGE TOP