AWS Glue ジョブ用の Apache Spark ウェブ UI の有効化
Apache Spark ウェブ UI を使用して、AWS Glue ジョブシステムで実行されている AWS Glue ETL ジョブをモニタリングおよびデバッグできます。Spark UI は、AWS Glue コンソールまたは AWS Command Line Interface (AWS CLI) を使用して設定できます。
Spark UI の設定 (コンソール)
AWS Management Console を使用して Spark UI を設定するには、以下のステップに従います。
Spark UI を有効にしてジョブを作成するには
AWS Management Console にサインインし、AWS Glue コンソール (https://console.aws.amazon.com/glue/
) を開きます。 -
ナビゲーションペインで [Jobs] (ジョブ) を選択します。
-
[ジョブの追加] を選択します。
-
[Configure the job properties (ジョブプロパティの設定)] で、[Monitoring options (モニタリングオプション)] を選択します。
-
[Spark UI] タブで、[有効化] を選択します。
-
ジョブの Spark イベントログを保存するための Amazon S3 パスを指定します。
既存のジョブを編集して Spark UI を有効にするには
https://console.aws.amazon.com/glue/
で AWS Glue コンソール を開きます。 -
ナビゲーションペインで [Jobs] (ジョブ) を選択します。
-
ジョブリストで既存のジョブを選択します。
-
[アクション]、[ジョブの編集)] の順に選択します。
-
[Monitoring options (モニタリングオプション)] を開きます。
-
[Spark UI] タブで、[有効化] を選択します。
-
ジョブの Spark イベントログを保存するための Amazon S3 パスを入力します。
新しいジョブのユーザー設定をセットアップして Spark UI を有効にするには
https://console.aws.amazon.com/glue/
で AWS Glue コンソール を開きます。 -
右上隅の [User preferences (ユーザー設定)] を選択します。
-
[Monitoring options (モニタリングオプション)] を開きます。
-
[Spark UI] タブで、[有効化] を選択します。
-
ジョブの Spark イベントログを保存するための Amazon S3 パスを指定します。
ジョブ実行オプションを設定して Spark UI を有効にするには
https://console.aws.amazon.com/glue/
で AWS Glue コンソール を開きます。 -
ナビゲーションペインで [Jobs] (ジョブ) を選択します。
-
ジョブリストで既存のジョブを選択します。
-
[Scripts (スクリプト)] および [ジョブの編集] を選択します。コードペインに移動します。
-
[Run job] (ジョブの実行) を選択します。
-
[Monitoring options (モニタリングオプション)] を開きます。
-
[Spark UI] タブで、[有効化] を選択します。
-
ジョブの Spark イベントログを保存するための Amazon S3 パスを指定します。
Spark UI の設定 (AWS CLI)
AWS CLI を使用して Spark UI 機能を有効にするには、以下のジョブパラメータを AWS Glue ジョブに渡します。詳細については、「AWS Glue で使用される特別なパラメータ」を参照してください。
'--enable-spark-ui': 'true', '--spark-event-logs-path': 's3://s3-event-log-path'
30 秒ごとに、AWS Glue から、指定した Amazon S3 パスに Spark イベントログがフラッシュされます。