Concetti - Amazon EMR

Concetti

Spazio dei nomi Kubernetes

Amazon EKS utilizza gli spazi dei nomi Kubernetes per suddividere le risorse del cluster tra più utenti e applicazioni. Questi spazi dei nomi costituiscono la base degli ambienti multi-tenant. Uno spazio dei nomi Kubernetes può avere Amazon EC2 o AWS Fargate come provider di calcolo. Questa flessibilità offre diverse opzioni di prestazioni e costi per l'esecuzione dei processi.

Cluster virtuale

Un cluster virtuale è uno spazio dei nomi Kubernetes con cui è registrato Amazon EMR. Amazon EMR utilizza cluster virtuali per eseguire processi e ospitare endpoint. Più cluster virtuali possono essere supportati dallo stesso cluster fisico. Tuttavia, ogni cluster virtuale esegue la mappatura a uno spazio dei nomi in un cluster EKS. I cluster virtuali non creano risorse attive che incrementano i costi in fattura o che richiedono la gestione del ciclo di vita all'esterno del servizio.

Esecuzione del processo

L'esecuzione di un processo è un'unità di lavoro, ad esempio un jar Spark, uno script PySpark o una query SparkSQL, che l'utente invia ad Amazon EMR su EKS. Un processo può avere più esecuzioni. Quando si invia l'esecuzione di un processo, occorre includere le seguenti informazioni:

  • Un cluster virtuale in cui deve essere eseguito il processo.

  • Un nome per identificare il processo.

  • Ruolo di esecuzione: un ruolo IAM definito che esegue il processo e consente di specificare le risorse a cui è possibile accedere tramite il processo.

  • L'etichetta di rilascio di Amazon EMR che specifica la versione delle applicazioni open source da utilizzare.

  • Gli artefatti da utilizzare durante l'invio del processo, ad esempio i parametri spark-submit.

Per impostazione predefinita, i log vengono caricati su Spark History Server e sono accessibili da AWS Management Console. È inoltre possibile inviare log eventi, log di esecuzione e parametri ad Amazon S3 e Amazon CloudWatch.

Container di Amazon EMR

Un container di Amazon EMR è il nome dell'API per Amazon EMR su EKS. Il prefisso emr-containers viene utilizzato nei seguenti scenari:

  • È il prefisso nei comandi CLI per Amazon EMR su EKS. Ad esempio, aws emr-containers start-job-run.

  • È il prefisso prima delle operazioni di policy IAM per Amazon EMR su EKS. Ad esempio, "Action": [ "emr-containers:StartJobRun"]. Per ulteriori informazioni, consulta Operazioni di policy per Amazon EMR su EKS.

  • È il prefisso utilizzato negli endpoint del servizio di Amazon EMR su EKS. Ad esempio, emr-containers.us-east-1.amazonaws.com. Per ulteriori informazioni, consulta Endpoint del servizio di Amazon EMR su EKS.