未分類

databricksのnotebookを使ってみよう その2

 

こんにちは。エクスチュアの松村です。

あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます

前回の記事はこちら

今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。

3.複数人で同じノートブックへの同時編集、コメント

Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。

また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。

これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。

4.ロギング 変更履歴の自動保存

Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。

右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。

 

5.ノートブックをスケジュールジョブとして実行

機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。

Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。

またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。

 

いかがでしたでしょうか。

弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です

ブログへの記事リクエストはこちらまでどうぞ。

databricksのnotebookを使ってみよう その1前のページ

Databricksが買収した8080Labのbamboolibをひと足早く使って見る次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. 未分類

    Databricksが買収した8080Labのbamboolibをひと足早く使って見る

    こんにちは、エクスチュアの松村です。先日、Databricks…

  2. Google BigQuery

    【BigQuery】TABLESAMPLE SYSTEMを日本一詳しく解説する

    1. はじめにこんにちは、エクスチュアの大崎です。…

  3. Generative AI

    ChainlitでのOAuth認証にスコープを追加する方法

    こんにちは!ChainlitというPythonでチャットアプ…

  4. データサイエンス

    回帰分析はかく語りき Part3 ロジスティック回帰

    こんにちは、小郷です。昨今は社会が複雑化したために、Yes…

  5. Google Tag Manager

    【GA4/GTM】dataLayerを活用しよう

    はじめにこんにちは、エクスチュアの岩川です。GA4の…

  6. 未分類

    1st Party Cookieと3rd Party Cookieの違いと昨今の問題点をざっくり解説…

    はじめに昨今のデジマ業界において扱いが難しくなっているCoo…

カテゴリ
最近の記事
  1. dbt Projects on SnowflakeをTASK…
  2. AWS発のAIエージェントIDE「Kiro」を使用した仕様駆…
  3. AWS発のAIエージェントIDE「Kiro」を使用した仕様駆…
  4. TableauとSnowflakeを接続する方法
  5. 【dbts25】Snowflake×PostgreSQLのニ…
  1. Tableau

    TableauでTreasure Data上のデータへ接続する方法(2023/0…
  2. Adobe Analytics

    Adobe新タグ登場って本当?AEP Web SDKって何だ?
  3. ブログ

    IPアドレスとは
  4. Cortex

    Cortex Analystを使ってみた
  5. Mouseflow

    Mouseflowのセッションリプレイのしくみ
PAGE TOP