Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Introducción a las sesiones interactivas de AWS Glue
En estas secciones, se describe cómo ejecutar sesiones interactivas de AWS Glue de forma local.
Requisitos previos para configurar las sesiones interactivas de manera local
A continuación, se indican los requisitos previos para instalar sesiones interactivas:
-
Las versiones compatibles de Python son de la 3.6 a la 3.9.
-
Consulte las secciones siguientes para obtener instrucciones para macOS, Linux y Windows.
Instrucciones para macOS/Linux
Instalación de Jupyter y kernels de Jupyter de las sesiones interactivas de AWS Glue
-
Instale
jupyter boto3
yaws-glue-sessions
con pip. Jupyter Lab también es compatible y se puede instalar en su lugar.pip3 install
--upgrade jupyter boto3 aws-glue-sessions
-
Los siguientes comandos utilizan
pip
para identificar la ubicación de instalación deaws-glue-sessions
. Luego, elbotocore
asociado instala los kernels de Jupyter.SITE_PACKAGES=$(pip3 show aws-glue-sessions | grep Location | awk '{print $2}') jupyter kernelspec install $SITE_PACKAGES/aws_glue_interactive_sessions_kernel/glue_pyspark jupyter kernelspec install $SITE_PACKAGES/aws_glue_interactive_sessions_kernel/glue_spark
Configuración de credenciales de sesión y región
Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:
-
Con los comandos mágicos
%iam_role
y%region
-
Con una línea adicional en
~/.aws/credentials
Configuración de un rol de sesión con un comando mágico
En la primera celda, escriba %iam_role <YourGlueServiceRole>
en la primera celda que se ejecuta.
Configuración de un rol de sesión con ~/.aws/credentials
El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utiliza para losAWS Glue trabajos de, siga esta guía, Configuración de permisos de IAM paraAWS Glue, para configurar uno.
Para establecer este rol como rol predeterminado de las sesiones interactivas:
-
Con un editor de texto, abra
~/.aws/credentials
. -
Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil
[Default]
. -
Agregue una línea en el perfil para el rol que quiera utilizar, como
glue_role_arn=<AWSGlueServiceRole>
. -
[Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con
region=us-east-1
y reemplazarus-east-1
con la región deseada. -
Guarde la configuración.
Para obtener más información, consulte Sesiones interactivas con IAM.
Ejecución del cuaderno de Jupyter
Para ejecutar el cuaderno de Jupyter, complete los siguientes pasos.
-
Para lanzar el cuaderno de Jupyter, ejecute el siguiente comando.
jupyter notebook
-
Elija New (Nuevo) y, a continuación, elija uno de los kernels de AWS Glue para comenzar a escribir código en AWS Glue.
Instrucciones para Windows
Instalación de Jupyter y kernels de las sesiones interactivas de AWS Glue
-
Utilice
pip
para instalar Jupyter. Jupyter Lab también es compatible y se puede instalar en su lugar.pip3 install
--upgrade jupyter boto3 aws-glue-sessions
-
Ejecute el siguiente comando para enumerar los paquetes instalados (opcional). Si Jupyter y
aws-glue-sessions
se han instalado en forma correcta, debería ver una larga lista de paquetes, que incluye jupyter 1.0.0 (o posterior).pip3 list
-
Instale los kernels de las sesiones en Jupyter ejecutando los siguientes comandos. Estos comandos buscarán dónde se ha instalado
aws-glue-sessions
en pip e instalarán los kernels de Jupyter allí.-
Cambie el directorio por el directorio de instalación
aws-glue-sessions
que se encuentra dentro del directoriosite-packages
de Python.Ventanas PowerShell:
cd ((pip3 show aws-glue-sessions | Select-String Location | % {$_ -replace("Location: ","")})+"\aws_glue_interactive_sessions_kernel")
-
Instale los núcleosAWS Glue PySpark yAWS Glue Scala.
jupyter-kernelspec install glue_pyspark
jupyter-kernelspec install glue_spark
-
Configuración de credenciales de sesión y región
Las sesiones interactivas de AWS Glue requieren los mismos permisos de IAM que los trabajos y los puntos de conexión de desarrollo de AWS Glue. Especifique el rol que se utiliza con las sesiones interactivas de una de estas dos formas:
-
Con los comandos mágicos
%iam_role
y%region
-
Con una línea adicional en
~/.aws/config
Configuración de un rol de sesión con un comando mágico
En la primera celda, escriba %iam_role <YourGlueServiceRole>
en la primera celda que se ejecuta.
Configuración de un rol de sesión con ~/.aws/config
El rol de servicio de AWS Glue para las sesiones interactivas se puede especificar en el propio cuaderno, o bien almacenarse junto con la configuración de la AWS CLI. Si tiene un rol que utiliza normalmente con los trabajos de AWS Glue, este será ese rol. Si no tiene un rol que utiliza para los trabajos de AWS Glue, siga esta guía, Configuración de permisos de IAM para AWS Glue, para configurar uno.
Para establecer este rol como rol predeterminado de las sesiones interactivas:
-
Con un editor de texto, abra
~/.aws/credentials
. -
Busque el perfil que utiliza para AWS Glue. Si no utiliza un perfil, use el perfil
[Default]
. -
Agregue una línea en el perfil para el rol que quiera utilizar, como
glue_role_arn=<AWSGlueServiceRole>
. -
[Opcional]: Si el perfil no tiene un conjunto de regiones predeterminadas, se recomienda agregar uno con
region=us-east-1
y reemplazarus-east-1
con la región deseada. -
Guarde la configuración.
Para obtener más información, consulte Sesiones interactivas con IAM.
Ejecución de Jupyter
Para ejecutar el cuaderno de Jupyter, complete los siguientes pasos.
-
Para lanzar el cuaderno de Jupyter, ejecute el siguiente comando.
jupyter notebook
-
Elija New (Nuevo) y, a continuación, elija uno de los kernels de AWS Glue para comenzar a escribir código en AWS Glue.
Actualización desde la versión preliminar de las sesiones interactivas
El kernel se actualizó con nuevos nombres cuando se lanzó con la versión 0.27. Para limpiar las versiones preliminares de los kernels ejecute lo siguiente desde un terminal o PowerShell.
nota
Si forma parte de cualquier otra versión preliminar de AWS Glue que requiera un modelo de servicio personalizado, al eliminar el kernel se eliminará también el modelo de servicio personalizado.
# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/