Creación de un trabajo de ETL mediante cuaderno en AWS Glue Studio
Para empezar a utilizar los cuaderno en la consola de AWS Glue Studio
-
Adjunte políticas de AWS Identity and Access Management al usuario de AWS Glue Studio y cree un rol de IAM para el trabajo y cuaderno de ETL.
-
Configure una seguridad adicional de IAM para cuadernos, como se describe en Concesión de permisos para el rol de IAM.
-
Abra la consola de AWS Glue Studio en https://console.aws.amazon.com/gluestudio/
. nota
Compruebe que el navegador no bloquea las cookies de terceros. Cualquier navegador que bloquee las cookies de terceros, ya sea de manera predeterminada o porque el usuario lo haya configurado así, impedirá que se inicien los cuadernos. Para obtener más información sobre cómo administrar las cookies, consulte:
-
Elija el icono Jobs (Trabajos) en el menú de navegación de la izquierda.
-
Elija Jupyter notebook (Cuaderno de Jupyter) y, luego, elija Create (Crear) para iniciar una nueva sesión de cuaderno.
-
En la página Create job in Jupyter notebook (Crear trabajo en cuaderno de Jupyter), proporcione el nombre del trabajo y elija qué rol de IAM desea utilizar. Seleccione Crear trabajo.
Tras un breve momento, aparece el editor de cuaderno.
-
Después de agregar el código, debe ejecutar la celda para iniciar una sesión. La celda se puede ejecutar de varias formas:
Pulse el botón de reproducción.
-
Use un método abreviado de teclado:
-
En MacOS, Command (Comando) + Enter (Intro) para ejecutar la celda.
-
En Windows, Shift + Enter (Intro) para ejecutar la celda.
-
Para obtener información sobre cómo escribir código mediante una interfaz de cuaderno de Jupyter, consulte The Jupyter Notebook User Documentation
(Documentación del usuario de cuaderno de Jupyter). -
Para probar el script, ejecute el script completo o celdas individuales. Cualquier salida de comando se mostrará en el área situada debajo de la celda.
-
Una vez que haya terminado de desarrollar el cuaderno, puede guardar el trabajo y luego ejecutarlo. Encontrará el script en la pestaña Script. Cualquier comando mágico que haya agregado al cuaderno se eliminará y no se guardará como parte del script del trabajo de AWS Glue generado. AWS Glue Studio agregará automáticamente un
job.commit()
al final del script generado desde el contenido del cuaderno.Para obtener más información sobre cómo ejecutar un trabajo, consulte Iniciar una ejecución de trabajo.