Google Cloud Platform

Google Compute Engine: 一定時間経過したらタスクを強制終了する

こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。
今回はGCEだけではなくてLinux全般で使える技です。

日々cronjobをGCE上で実行しているのですが、たまにものすごく時間が掛かってしまうdataprocの処理が出てきました。
1時間経っても終了しない場合は強制終了させる必要があったので、timeoutコマンドでタスクを終了させてからgcloudコマンドでdataprocのジョブをkillする事にしました。

で、これを実装したbashスクリプトはこのようになりました。

#!/bin/bash

#timeoutコマンドで3600秒後にkill
timeout -sKILL 3600 gcloud dataproc jobs submit spark --cluster mycluster-1 --region us-west1 --class com.foobar.hoge --jars gs://my-bucket-1/hoge.jar

#timeoutコマンドで終了したタスクは終了コードが124〜137になるのでチェック
if [ $? -ge 124 ]; then
    
    #実行中のジョブIDをlistから取得
    JOBID=`gcloud dataproc jobs list --region us-west1 --cluster mycluster-1 --state-filter active|grep RUNNING|cut -f 1 -d ' '`

    echo "TIMEOUT! killing job: ${JOBID}"
    
    #yesコマンドでY/nの質問に自動回答
    yes | gcloud dataproc jobs kill --region us-west1 ${JOBID}

fi

他にも、時間の掛かるタスクを強制終了したらslackに書き込むなど、色々応用出来るので即席監視ツールっぽいのが出来上がりますね。

弊社ではGoogle Cloud Platformを使ったデーバ分析基盤の構築支援業務を行っています。
そして、このくらいのbashスクリプトをササっと書ける「Linux大好きなマーケティングテクノロジー系エンジニア」を募集しております。
お問い合わせはこちらからどうぞ

関連記事

  1. Adobe Analytics

    AA + GA : SafariのITP2.1に備えてphpでクッキーを永続化する

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。Saf…

  2. Adobe Analytics

    Adobe Analyticsに入り切らないデータをBigQueryに投入する

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。Ado…

  3. Adobe Analytics

    Adobe Analytics: データフィードをGoogle BigQueryのテーブルにロードす…

    こんにちは、エクスチュアCTOの権です。前回のブログの続きです…

  4. Google BigQuery

    GoogleNext 2019レポート:3日目

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。Googl…

  5. Cloud Dataflow

    Firebase AnalyticsのデータをフラットなCSVに変換する – Googl…

    こんにちは。エクスチュアCTOの権です。以前Firebas…

  6. Adobe Analytics

    AdobeAnalyticsでReactNativeアプリを計測する

    こんにちは、エクスチュアの権泳東(コン・ヨンドン)です。今回は…

最近の記事

  1. データアナリスト/データエンジニア向けNext19まとめ
  2. BigQuery BI Engine解説
  3. GoogleNext 2019レポート:3日目
  4. Adobe Summit 2019 レポート
  5. GoogleNext 2019レポート:2日目
  1. Google Cloud Platform

    Looker: LookerbotでSlackにグラフ画像をスケジュール投稿する…
  2. Google Tag Manager

    Google Tag Manager: 離脱リンクのクリックをトリガーにする
  3. Google BigQuery

    BigQuery BI Engine解説
  4. Google Analytics

    Google Analytics: アプリSDKのclientIDを取得する
  5. Google Cloud Platform

    Google Compute Engine: 一定時間経過したらタスクを強制終了…
PAGE TOP