Démarrage avec séances interactives AWS Glue - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Démarrage avec séances interactives AWS Glue

Ces sections décrivent comment exécuter des séances interactives AWS Glue localement.

Conditions préalables à la configuration locale des séances interactives

Les conditions suivantes sont requises pour installer des séances interactives :

  • Les versions de Python prises en charge vont des versions 3.6 à 3.10 et ultérieures.

  • Consultez les sections ci-dessous pour les instructions MacOS/Linux et Windows.

Installation de Jupyter et de sessions AWS Glue interactives (noyaux Jupyter)

Pour installer le noyau localement, procédez comme suit.

La commande install-glue-kernels installe les KernelSpec Jupyter pour les noyaux Pyspark et Spark et installe également les logos dans le bon répertoire.

pip3 install --upgrade jupyter boto3 aws-glue-sessions
install-glue-kernels

Exécution de Jupyter

Pour exécuter Jupyter Notebook, effectuez les étapes suivantes.

  1. Pour lancer Jupyter Notebook, exécutez la commande suivante.

    jupyter notebook
  2. Choisissez New (Nouveau), puis choisissez l'un des noyaux AWS Glue pour commencer à coder par rapport au AWS Glue.

Configuration des informations d'identification de séance et de région

Instructions MacOS/Linux

Les séances interactives AWS Glue requièrent les mêmes autorisations IAM que les tâches AWS Glue et les points de terminaison de développement. Spécifiez le rôle utilisé avec des séances interactives de l'une des deux manières suivantes :

  1. Avec magics %iam_role et %region

  2. Avec une ligne supplémentaire dans ~/.aws/config

Configuration d'un rôle de séance avec magic

Dans la première cellule, saisissez %iam_role <YourGlueServiceRole> dans la première cellule exécutée.

Configuration d'un rôle de séance avec ~/.aws/config

AWS GlueLe rôle de service pour les sessions interactives peut être spécifié dans le bloc-notes lui-même ou stocké à côté de la AWS CLI configuration. Si vous avez un rôle que vous utilisez généralement avec les tâches AWS Glue, ce sera ce rôle. Si vous n'avez pas de rôle que vous utilisez pour les tâches AWS Glue, veuillez suivre ce guide, Configuring IAM permissions for AWS Glue, pour en configurer un.

Pour définir ce rôle comme rôle par défaut pour les séances interactives, procédez comme suit :

  1. Ouvrez ~/.aws/config avec un éditeur de texte.

  2. Recherchez le profil que vous utilisez pour AWS Glue. Si vous n'avez pas de profil, utilisez le profil [Default].

  3. Ajoutez une ligne dans le profil pour le rôle que vous avez l'intention d'utiliser comme glue_role_arn=<AWSGlueServiceRole>.

  4. [Facultatif] : si votre profil ne possède pas de région par défaut, je vous recommande d'en ajouter une avec region=us-east-1, en remplaçant us-east-1 par la région de votre choix.

  5. Enregistrez la configuration.

Pour plus d’informations, consultez Séances interactives avec IAM.

Instructions Windows

Les séances interactives AWS Glue requièrent les mêmes autorisations IAM que les tâches AWS Glue et les points de terminaison de développement. Spécifiez le rôle utilisé avec des séances interactives de l'une des deux manières suivantes :

  1. Avec magics %iam_role et %region

  2. Avec une ligne supplémentaire dans ~/.aws/config

Configuration d'un rôle de séance avec magic

Dans la première cellule, saisissez %iam_role <YourGlueServiceRole> dans la première cellule exécutée.

Configuration d'un rôle de session avec ~/.aws/config

AWS GlueLe rôle de service pour les sessions interactives peut être spécifié dans le bloc-notes lui-même ou stocké à côté de la AWS CLI configuration. Si vous avez un rôle que vous utilisez généralement avec les tâches AWS Glue, ce sera ce rôle. Si vous n'avez pas de rôle que vous utilisez pour les tâches AWS Glue, veuillez suivre ce guide, Configuration des autorisations IAM pour AWS Glue , pour en configurer un.

Pour définir ce rôle comme rôle par défaut pour les séances interactives, procédez comme suit :

  1. Ouvrez ~/.aws/config avec un éditeur de texte.

  2. Recherchez le profil que vous utilisez pour AWS Glue. Si vous n'avez pas de profil, utilisez le profil [Default].

  3. Ajoutez une ligne dans le profil pour le rôle que vous avez l'intention d'utiliser comme glue_role_arn=<AWSGlueServiceRole>.

  4. [Facultatif] : si votre profil ne possède pas de région par défaut, je vous recommande d'en ajouter une avec region=us-east-1, en remplaçant us-east-1 par la région de votre choix.

  5. Enregistrez la configuration.

Pour plus d’informations, consultez Séances interactives avec IAM.

Mise à niveau à partir de l'aperçu des séances interactives

Le noyau a été mis à niveau avec de nouveaux noms lors de sa sortie avec la version 0.27. Pour nettoyer les versions d'aperçu des noyaux, exécutez ce qui suit depuis un terminal ou PowerShell.

Note

Si vous faites partie d'un autre aperçu AWS Glue qui nécessite un modèle de service personnalisé, la suppression du noyau supprimera le modèle de service personnalisé.

# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/