Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Amazon EMR Studio exécute des commandes de bloc-notes à l'aide d'un noyau sur un cluster EMR. Avant de sélectionner un noyau, vous devez associer l'espace de travail à un cluster utilisant des EC2 instances Amazon, à un cluster Amazon EMR on EKS ou à une application EMR sans serveur. EMR Studio vous permet d'rattacher des Workspaces à des clusters nouveaux ou existants, et vous donne la possibilité de changer de cluster sans fermer le Workspace.
Cette section aborde les sujets suivants pour vous aider à travailler avec des clusters et à les mettre en service pour EMR Studio :
Associer un EC2 cluster Amazon à un espace de travail EMR Studio
Vous pouvez associer un cluster EMR exécuté sur Amazon EC2 à un espace de travail lorsque vous créez l'espace de travail, ou associer un cluster à un espace de travail existant. Si vous souhaitez créer un nouveau cluster, consultez Création et rattachement d'un nouveau cluster EMR à un Workspace EMR Studio.
Note
Un Workspace d’un Studio où la propagation d’identité approuvée IAM Identity Center est activée ne peut être attaché qu’à un cluster EMR dont la configuration de sécurité inclut Identity Center activé.
Connectez-vous à un cluster de calcul Amazon EMR lorsque vous créez un Workspace
-
Dans la boîte de dialogue Créer un Workspace, assurez-vous que vous avez déjà sélectionné un sous-réseau pour le nouvel Workspace. Développez la section Configuration avancée.
-
Choisissez Attacher le Workspace à un cluster EMR.
-
Dans la liste déroulante Clusters EMR, sélectionnez un cluster EMR existant à rattacher au Workspace.
Après avoir attaché un cluster, terminez la création du Workspace. Lorsque vous ouvrez le nouvel Workspace pour la première fois et que vous choisissez le panneau Clusters EMR, le cluster sélectionné devrait être rattaché.
Rattacher un cluster Amazon EMR à un Workspace EMR Studio
Outre l'utilisation de clusters Amazon EMR exécutés sur Amazon EC2, vous pouvez associer un espace de travail à un cluster Amazon EMR on EKS pour exécuter du code de bloc-notes. Pour plus d'informations sur Amazon EMR, veuillez consulter Qu'est-ce qu'Amazon EMR sur EKS ?.
Avant de pouvoir connecter un Workspace à un cluster Amazon EMR sur EKS, l'administrateur de votre studio doit vous accorder des autorisations d'accès.
Note
Vous ne pouvez pas lancer un cluster Amazon EMR sur EKS dans un Studio EMR qui utilise la propagation d’identité approuvée IAM Identity Center.
Rattacher un cluster de calcul Amazon EMR lorsque vous créez un Workspace
-
Dans la boîte de dialogue Créer un Workspace, développez la section Configuration avancée.
-
Choisissez Attacher le Workspace à un cluster Amazon EMR sur EKS.
-
Sous Cluster Amazon EMR sur EKS, choisissez un cluster dans la liste déroulante.
-
Sous Sélectionner un point de terminaison, choisissez un point de terminaison géré à rattacher au Workspace. Un point de terminaison géré est une passerelle qui permet à EMR Studio de communiquer avec le cluster de votre choix.
-
Choisissez Créer un Workspace pour terminer le processus de création du Workspace et rattacher le cluster sélectionné.
Après avoir rattaché un cluster, vous pouvez terminer de créer le Workspace. Lorsque vous ouvrez le nouvel Workspace pour la première fois et que vous choisissez le panneau Clusters EMR, le cluster sélectionné devrait être rattaché.
Attacher une application Amazon EMR sans serveur à un espace de travail EMR Studio
Vous pouvez attacher un espace de travail à une application EMR sans serveur pour exécuter des charges de travail interactives. Pour plus d'informations, consultez la rubrique relative à l'utilisation des blocs-notes pour exécuter des charges de travail interactives avec EMR sans serveur via EMR Studio.
Note
Vous ne pouvez pas attacher une application EMR sans serveur à un Studio EMR qui utilise la propagation d’identité approuvée IAM Identity Center.
Exemple Associer un espace de travail à une application EMR sans serveur dans JupyterLab
Avant de pouvoir connecter un espace de travail à une application EMR sans serveur, l'administrateur de votre compte doit vous accorder les autorisations d'accès décrites dans la rubrique Required permissions for interactive workloads.
-
Accédez à EMR Studio pour sélectionner votre espace de travail, puis sélectionnez Lancer une instance WorkSpace > Lancement rapide.
-
À l'intérieur JupyterLab, ouvrez l'onglet Cluster dans la barre latérale gauche.
-
Sélectionnez EMR sans serveur comme option de calcul, puis sélectionnez une application EMR sans serveur et un rôle d'exécution.
-
Pour attacher le cluster à votre espace de travail, choisissez Attacher.
Maintenant, lorsque vous ouvrez cet espace de travail, vous devriez voir l'application sélectionnée attachée.
Création et rattachement d'un nouveau cluster EMR à un Workspace EMR Studio
Les utilisateurs avancés d'EMR Studio peuvent configurer de nouveaux clusters EMR exécutés sur Amazon EC2 afin de les utiliser avec un espace de travail. Toutes les applications Big Data requises pour EMR Studio sont installées par défaut sur le nouveau cluster.
Pour créer des clusters, l'administrateur de votre studio doit d'abord vous donner l'autorisation à l'aide d'une politique de session. Pour de plus amples informations, veuillez consulter Créer des politiques d'autorisation pour les utilisateurs d'EMR Studio.
Vous pouvez créer un nouveau cluster dans la boîte de dialogue Créer un Workspace ou depuis le panneau Cluster de l'interface utilisateur du Workspace. Dans les deux cas, vous avez le choix entre deux options de création de clusters :
-
Création d'un cluster EMR : créez un cluster EMR en choisissant le type et le nombre d' EC2 instances Amazon.
-
Utiliser un modèle de cluster : mettez en service un cluster en sélectionnant un modèle de cluster prédéfini. Cette option apparaît si vous êtes autorisé à utiliser des modèles de cluster.
Note
Si vous avez activé la propagation d’identité approuvée avec IAM Identity Center pour votre Studio, vous devez utiliser un modèle pour créer un cluster.
Créer un cluster EMR en fournissant une configuration de cluster
-
Choisissez un point de départ.
Pour… Faites ceci... Créez le cluster lorsque vous créez un Workspace à l'aide de la boîte de dialogue Créer un Workspace. Développez la section Configuration avancée dans la boîte de dialogue Créer un Workspace, puis sélectionnez Créer un cluster EMR. Créez le cluster à partir du panneau du cluster EMR de l'interface utilisateur de Workspace après avoir créé un Workspace. Choisissez l'onglet Clusters EMR dans la barre latérale gauche d'un Workspace ouvert, développez la section Configuration avancée et choisissez Créer un cluster. -
Entrez un nom de cluster. Le fait de nommer le cluster vous permet de le retrouver ultérieurement dans la liste des clusters EMR Studio.
-
Pour la version d'Amazon EMR, choisissez une version d'Amazon EMR pour le cluster.
-
Par exemple, sélectionnez le type et le nombre d' EC2 instances Amazon pour le cluster. Pour plus d'informations sur le choix du type d'instance, consultez Configurer les types d' EC2 instances Amazon à utiliser avec Amazon EMR. Une instance est utilisée pour le nœud primaire.
-
Sélectionnez un sous-réseau dans lequel EMR Studio peut lancer le nouveau cluster. Chaque option de sous-réseau est préapprouvée par l'administrateur de votre studio, et votre Workspace doit être en mesure de se connecter à un cluster dans n'importe quel sous-réseau répertorié.
-
Choisissez un URI S3 pour le stockage des journaux.
-
Choisissez Créer un cluster EMR pour mettre en service le cluster. Si vous utilisez la boîte de dialogue Créer un Workspace, choisissez Créer un Workspace pour créer le Workspace et mettre en service le cluster. Une fois qu'EMR Studio a mis en service le nouveau cluster, il le rattache au Workspace.
Créer un cluster en utilisant un modèle de cluster
-
Choisissez un point de départ.
Pour… Faites ceci... Créez le cluster lorsque vous créez un Workspace à l'aide de la boîte de dialogue Créer un Workspace. Développez la section Configuration avancée dans la boîte de dialogue Créer un Workspace, puis sélectionnez Utiliser un modèle de cluster. Créez le cluster à partir du panneau du cluster EMR de l'interface utilisateur de Workspace. Choisissez l'onglet Clusters EMR dans la barre latérale gauche d'un Workspace ouvert, développez la section Configuration avancée et choisissez Modèle de cluster. -
Sélectionnez un modèle de cluster dans la liste déroulante. Chaque modèle de cluster disponible inclut une brève description pour vous aider à effectuer une sélection.
-
Le modèle de cluster que vous choisissez peut comporter des paramètres supplémentaires tels que la version de version d'Amazon EMR ou le nom du cluster. Vous pouvez choisir ou insérer des valeurs, ou utiliser les valeurs par défaut sélectionnées par votre administrateur.
-
Sélectionnez un sous-réseau dans lequel EMR Studio peut lancer le nouveau cluster. Chaque option de sous-réseau est préapprouvée par l'administrateur de votre studio, et votre Workspace doit être en mesure de se connecter à un cluster dans n'importe quel sous-réseau.
-
Choisissez Utiliser un modèle de cluster pour mettre en service le cluster et le rattacher au Workspace. Il faudra quelques minutes à EMR Studio pour créer le cluster. Si vous utilisez la boîte de dialogue Créer un Workspace, choisissez Créer un Workspace pour créer le Workspace et mettre en service le cluster. Une fois qu'EMR Studio a mis en service le nouveau cluster, il le rattache à votre Workspace.
Détacher un calcul d'un espace de travail EMR Studio
Pour échanger le cluster rattaché à un Workspace, vous pouvez détacher un cluster de l'interface utilisateur du Workspace.
Détacher un cluster d'un Workspace
-
dans le Workspace que vous souhaitez détacher d'un cluster, cliquez sur l'icône clusters EMR dans la barre latérale gauche pour ouvrir le panneau Cluster.
-
Sous Sélectionner un cluster, choisissez Détacher et attendez qu'EMR Studio détache le cluster. Lorsque le cluster est détaché, un message de réussite s'affiche.
Pour détacher une application EMR sans serveur d'un espace de travail EMR Studio
Pour échanger le calcul attaché à un espace de travail, vous pouvez détacher l'application de l'interface utilisateur de l'espace de travail.
-
Dans l'espace de travail que vous souhaitez détacher d'un cluster, cliquez sur l'icône de calcul Amazon EMR dans la barre latérale gauche pour ouvrir le panneau Calcul.
-
Sous Sélectionner un calcul, choisissez Détacher et attendez qu'EMR Studio détache l'application. Lorsque l'application est détachée, un message de réussite s'affiche.