Geben Sie beim Erstellen eines Clusters eine Konfiguration in der Konsole an Geben Sie AWS CLI beim Erstellen eines Clusters eine Konfiguration an, indem Sie Beim Erstellen eines Clusters eine Konfiguration mit dem Java SDK angeben

Anwendungen bei der Clustererstellung konfigurieren

Wenn Sie einen Cluster erstellen, können Sie die Standardkonfigurationen für Anwendungen mithilfe der Amazon EMR-Konsole, der AWS Command Line Interface (AWS CLI) oder des AWS SDK überschreiben.

Um die Standardkonfiguration für eine Anwendung zu überschreiben, geben Sie benutzerdefinierte Werte in einer Konfigurationsklassifizierung an. Eine Konfigurationsklassifizierung entspricht einer XML-Konfigurationsdatei für eine Anwendung, z. B. hive-site.xml

Konfigurationsklassifizierungen variieren je nach Amazon-EMR-Version. Eine Liste der Konfigurationsklassifizierungen, die in einer bestimmten Release-Version verfügbar sind, finden Sie auf der Release-Detailseite. In diesem Beispiel wird Amazon-EMR-Version 6.4.0 verwendet.

Geben Sie beim Erstellen eines Clusters eine Konfiguration in der Konsole an

Um eine Konfiguration bereitzustellen, navigieren Sie zur Seite Cluster erstellen und erweitern Sie Softwareeinstellungen. Sie können dann die Konfiguration direkt mittels JSON oder einer Syntax-Kurznotation angeben, dargestellt als abgedunkelter Text in der Konsole. Andernfalls können Sie eine Amazon-S3-URI für eine Datei mit einem Configurations-JSON-Objekt bereitstellen.

Um eine Konfiguration für eine Instanzgruppe bereitzustellen, wählen Sie einen Cluster in Ihrer Clusterliste aus und wählen Sie dann die Registerkarte Konfigurationen. Wählen Sie in der Tabelle mit den Instanzgruppenkonfigurationen die zu bearbeitende Instanzgruppe aus und klicken Sie dann auf Neu konfigurieren.

Geben Sie AWS CLI beim Erstellen eines Clusters eine Konfiguration an, indem Sie

Sie können eine Konfiguration für create-cluster bereitstellen, indem Sie den Pfad zu einer JSON-Datei angeben, die lokal oder in Amazon S3 gespeichert ist. Im folgenden Beispiel wird davon ausgegangen, dass Sie bereits erstellte Standardrollen für Amazon EMR verwenden. Wenn Sie die Rollen erstellen müssen, führen Sie zuerst aws emr create-default-roles aus.

Wenn sich die Konfiguration im lokalen Verzeichnis befindet, können Sie den folgenden Beispielbefehl verwenden.


aws emr create-cluster --use-default-roles --release-label emr-7.10.0 --applications Name=Hive \
--instance-type m5.xlarge --instance-count 3 --configurations file://./configurations.json

Wenn sich Ihre Konfiguration in einem Amazon-S3-Pfad befindet, müssen Sie die folgende Problemumgehung einrichten, bevor Sie den Amazon-S3-Pfad an den create-cluster-Befehl übergeben.


#!/bin/sh
# Assume the ConfigurationS3Path is not public, and its present in the same AWS account as the EMR cluster
ConfigurationS3Path="s3://amzn-s3-demo-bucket/config.json"
# Get a presigned HTTP URL for the s3Path
ConfigurationURL=`aws s3 presign $ConfigurationS3Path --expires-in 300`
# Fetch the presigned URL, and minify the JSON so that it spans only a single line
Configurations=`curl $ConfigurationURL | jq -c .`
aws emr create-cluster --use-default-roles --release-label emr-5.34.0 --instance-type m5.xlarge --instance-count 2 --applications Name=Hadoop Name=Spark --configurations $Configurations

Beim Erstellen eines Clusters eine Konfiguration mit dem Java SDK angeben

Der folgende Programmausschnitt zeigt, wie eine Konfiguration mit AWS SDK für Java bereitgestellt wird.


Application hive = new Application().withName("Hive");

Map<String,String> hiveProperties = new HashMap<String,String>();
	hiveProperties.put("hive.join.emit.interval","1000");
	hiveProperties.put("hive.merge.mapfiles","true");
	    
Configuration myHiveConfig = new Configuration()
	.withClassification("hive-site")
	.withProperties(hiveProperties);

RunJobFlowRequest request = new RunJobFlowRequest()
	.withName("Create cluster with ReleaseLabel")
	.withReleaseLabel("emr-5.20.0")
	.withApplications(hive)
	.withConfigurations(myHiveConfig)
	.withServiceRole("EMR_DefaultRole")
	.withJobFlowRole("EMR_EC2_DefaultRole")
	.withInstances(new JobFlowInstancesConfig()
		.withEc2KeyName("myEc2Key")
		.withInstanceCount(3)
		.withKeepJobFlowAliveWhenNoSteps(true)
		.withMasterInstanceType("m4.large")
		.withSlaveInstanceType("m4.large")
	);

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Anwendungen konfigurieren

Eine Instance-Gruppe in einem laufenden Cluster neu konfigurieren