Reichen Sie einen Auftrag ein, der ausgeführt wird mit `StartJobRun`

Um einen Job einzureichen, führen Sie ihn mit einer JSON Datei mit bestimmten Parametern aus

Erstellen Sie eine start-job-run-request.json Datei und geben Sie die erforderlichen Parameter für Ihre Jobausführung an, wie die folgende JSON Beispieldatei zeigt. Weitere Informationen zu den Parametern finden Sie unter Optionen für die Konfiguration einer Aufgabenausführung.


{
  "name": "myjob", 
  "virtualClusterId": "123456",  
  "executionRoleArn": "iam_role_name_for_job_execution", 
  "releaseLabel": "emr-6.2.0-latest", 
  "jobDriver": {
    "sparkSubmitJobDriver": {
      "entryPoint": "entryPoint_location",
      "entryPointArguments": ["argument1", "argument2", ...],  
       "sparkSubmitParameters": "--class <main_class> --conf spark.executor.instances=2 --conf spark.executor.memory=2G --conf spark.executor.cores=2 --conf spark.driver.cores=1"
    }
  }, 
  "configurationOverrides": {
    "applicationConfiguration": [
      {
        "classification": "spark-defaults", 
        "properties": {
          "spark.driver.memory":"2G"
         }
      }
    ], 
    "monitoringConfiguration": {
      "persistentAppUI": "ENABLED", 
      "cloudWatchMonitoringConfiguration": {
        "logGroupName": "my_log_group", 
        "logStreamNamePrefix": "log_stream_prefix"
      }, 
      "s3MonitoringConfiguration": {
        "logUri": "s3://my_s3_log_location"
      }
    }
  }
}

Verwenden Sie den start-job-run-Befehl mit einem Pfad zu der lokal gespeicherten start-job-run-request.json-Datei.
```
aws emr-containers start-job-run \
--cli-input-json file://./start-job-run-request.json
```

So starten Sie eine Auftragsausführung mithilfe des `start-job-run`-Befehls

Geben Sie alle angegebenen Parameter im StartJobRun-Befehl an, wie das folgende Beispiel zeigt.


aws emr-containers start-job-run \
--virtual-cluster-id 123456 \
--name myjob \
--execution-role-arn execution-role-arn \
--release-label emr-6.2.0-latest \
--job-driver '{"sparkSubmitJobDriver": {"entryPoint": "entryPoint_location", "entryPointArguments": ["argument1", "argument2", ...], "sparkSubmitParameters": "--class <main_class> --conf spark.executor.instances=2 --conf spark.executor.memory=2G --conf spark.executor.cores=2 --conf spark.driver.cores=1"}}' \
--configuration-overrides '{"applicationConfiguration": [{"classification": "spark-defaults", "properties": {"spark.driver.memory": "2G"}}], "monitoringConfiguration": {"cloudWatchMonitoringConfiguration": {"logGroupName": "log_group_name", "logStreamNamePrefix": "log_stream_prefix"}, "persistentAppUI":"ENABLED",  "s3MonitoringConfiguration": {"logUri": "s3://my_s3_log_location" }}}'

Geben Sie für Spark SQL alle angegebenen Parameter im StartJobRun Befehl an, wie das folgende Beispiel zeigt.


aws emr-containers start-job-run \
--virtual-cluster-id 123456 \
--name myjob \
--execution-role-arn execution-role-arn \
--release-label emr-6.7.0-latest \
--job-driver '{"sparkSqlJobDriver": {"entryPoint": "entryPoint_location", "sparkSqlParameters": "--conf spark.executor.instances=2 --conf spark.executor.memory=2G --conf spark.executor.cores=2 --conf spark.driver.cores=1"}}' \
--configuration-overrides '{"applicationConfiguration": [{"classification": "spark-defaults", "properties": {"spark.driver.memory": "2G"}}], "monitoringConfiguration": {"cloudWatchMonitoringConfiguration": {"logGroupName": "log_group_name", "logStreamNamePrefix": "log_stream_prefix"}, "persistentAppUI":"ENABLED",  "s3MonitoringConfiguration": {"logUri": "s3://my_s3_log_location" }}}'

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Registrieren Sie den EKS Amazon-Cluster bei Amazon EMR

Spark-Operator

Reichen Sie einen Auftrag ein, der ausgeführt wird mit StartJobRun

Um einen Job einzureichen, führen Sie ihn mit einer JSON Datei mit bestimmten Parametern aus

So starten Sie eine Auftragsausführung mithilfe des start-job-run-Befehls

Reichen Sie einen Auftrag ein, der ausgeführt wird mit `StartJobRun`

So starten Sie eine Auftragsausführung mithilfe des `start-job-run`-Befehls