Rilasci 6.10.0 di Amazon EMR su EKS

I seguenti rilasci 6.10.0 di Amazon EMR sono disponibili per Amazon EMR su EKS. Seleziona un rilascio emr-6.10.0-XXXX specifico per visualizzare ulteriori dettagli, come il relativo tag dell'immagine di container.

emr-6.10.0-latest
emr-6.10.0-20230905
emr-6.10.0-20230624
emr-6.10.0-20230421
emr-6.10.0-20230403
emr-6.10.0-20230220
emr-6.10.0- spark-rapids-latest
emr-6.10.0-spark-rapids-20230624
emr-6.10.0-spark-rapids-20230220
emr-6.10.0-java11-latest
emr-6.10.0-java11-20230624
emr-6.10.0-java11-20230220
notebook-spark/emr-6.10.0-latest
notebook-spark/emr-6.10.0-20230624
notebook-spark/emr-6.10.0-20230220
notebook-python/emr-6.10.0-latest
notebook-python/emr-6.10.0-20230624
notebook-python/emr-6.10.0-20230220

Note di rilascio di Amazon EMR 6.10.0

Applicazioni supportate ‐ AWS SDK per Java 1.12.397, Spark 3.3.1-amzn-0, Hudi 0.12.2-amzn-0, Iceberg 1.1.0-amzn-0, Delta 2.2.0.
Componenti supportati: aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

Classificazioni di configurazione supportate:

StartJobRunDa usare CreateManagedEndpoint APIscon e:

Classificazioni	Descrizioni
`core-site`	Modifica i valori nel file `core-site.xml` di Hadoop.
`emrfs-site`	Modifica le impostazioni EMRFS.
`spark-metrics`	Modifica i valori nel file `metrics.properties` di Spark.
`spark-defaults`	Modifica i valori nel file `spark-defaults.conf` di Spark.
`spark-env`	Modifica i valori nell'ambiente Spark.
`spark-hive-site`	Modifica i valori nel file `hive-site.xml` di Spark.
`spark-log4j`	Modifica i valori nel file `log4j.properties` di Spark.

Da utilizzare specificamente con CreateManagedEndpoint APIs:

Classificazioni	Descrizioni
`jeg-config`	Modifica i valori nel file `jupyter_enterprise_gateway_config.py` Jupyter Enterprise Gateway.
`jupyter-kernel-overrides`	Modifica il valore per l'immagine del kernel nel file Jupyter Kernel Spec.

Le classificazioni di configurazione consentono di personalizzare le applicazioni. Spesso corrispondono a un file XML di configurazione per l'applicazione, ad esempio spark-hive-site.xml. Per ulteriori informazioni, consulta la sezione Configurazione delle applicazioni.

Funzionalità significative

Operatore Spark: con Amazon EMR su EKS 6.10.0 e versioni successive, puoi utilizzare l'operatore Kubernetes per Apache Spark, ovvero l'operatore Spark, per implementare e gestire applicazioni Spark con il runtime di rilascio di Amazon EMR sui tuoi cluster Amazon EKS. Per ulteriori informazioni, consulta Esecuzione dei processi Spark con l'operatore Spark.
Java 11: con Amazon EMR su EKS 6.10 e versioni successive, puoi avviare Spark con il runtime di Java 11. Per farlo, trasmetti emr-6.10.0-java11-latest come etichetta di rilascio. Consigliamo di convalidare ed eseguire test delle prestazioni prima di trasferire i carichi di lavoro di produzione dall'immagine Java 8 all'immagine Java 11.
Per l'integrazione di Amazon Redshift per Apache Spark, Amazon EMR su EKS 6.10.0 rimuove la dipendenza da minimal-json.jar e aggiunge in automatico i jar relativi a spark-redshift necessari al percorso di classe dell'executor per Spark: spark-redshift.jar, spark-avro.jar e RedshiftJDBC.jar.

Modifiche

Il committer ottimizzato per EMRFS S3 è ora abilitato per impostazione predefinita per formati parquet, ORC e basati su testo (inclusi CSV e JSON).

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

emr-6.11.0-20230509

emr-6.10.0-latest