Cuadernos de EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cuadernos de EMR

Puede utilizar los portátiles de Amazon EMR junto con clústeres de Amazon EMR en ejecuciónApache Sparkcrear y abrirJupyterInterfaces Notebook y JupyterLab dentro de la consola de Amazon EMR. Un bloc de notas de EMR es un bloc de notas «sin servidor» que puede utilizar para ejecutar consultas y código. A diferencia de un bloc de notas tradicional, el contenido de un bloc de notas de EMR (las ecuaciones, las consultas, los modelos, el código y el texto narrativo en las celdas del bloc de notas) se ejecutan en un cliente. Los comandos se ejecutan utilizando un kernel en el clúster de EMR. El contenido del bloc de notas también se guarda en Amazon S3 por separado de los datos del clúster para mayor durabilidad y flexibilidad en la reutilización

Puede iniciar un clúster, asociar un bloc de notas de EMR para análisis y, a continuación, terminar el clúster. También puede cerrar un bloc de notas asociado a un clúster en ejecución y cambiar a otro. Varios usuarios pueden asociar blocs de notas al mismo clúster de forma simultánea y compartir entre sí archivos de bloc de notas en Amazon S3. Estas características le permiten ejecutar clústeres bajo demanda para ahorrar costes y reducir el tiempo dedicado a reconfigurar blocs de notas para diferentes clústeres y conjuntos de datos.

También puede ejecutar un portátil EMR mediante programación mediante la API de EMR, sin necesidad de interactuar con la consola de EMR («ejecución sin cabeza»). Debe incluir una celda en el bloc de notas de EMR que tenga una etiqueta de parámetros. Esta celda permite que un script pase nuevos valores de entrada al bloc de notas. Los cuadernos parametrizados se pueden reutilizar con distintos conjuntos de valores de entrada. No es necesario hacer copias del mismo bloc de notas para editarlo y ejecutarlo con nuevos valores de entrada. EMR crea y guarda el bloc de notas de salida en S3 para cada ejecución del bloc de notas parametrizado. Para obtener ejemplos de código de API de blocs de notas de EMRComandos de ejemplo para ejecutar EMR Notebooks mediante programación.

importante

EMR Notebooks son compatibles con clústeres creados con Amazon EMR 5.18.0 y versiones posteriores. Recomendamos encarecidamente que utilice EMR Notebooks con clústeres de creados con la última versión de Amazon EMR, en particular, versiones 5.30.0, 5.32.0 y posterior, o 6.2.0 y posterior. Con estas versiones, se realizó un cambio para que los kernels de Jupyter se ejecuten en el clúster asociado, en lugar de hacerlo en una instancia de Jupyter. Este cambio ayuda a mejorar el rendimiento y mejora su capacidad para personalizar kernels y bibliotecas. Para obtener más información, consulte Diferencias de capacidades por versión de clúster.

Se aplican cargos aplicables por almacenamiento de Amazon S3 y clústeres de Amazon EMR.