Configuración de la persistencia de los cuadernos en Amazon S3 - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de la persistencia de los cuadernos en Amazon S3

Puede configurar un JupyterHub clúster en Amazon EMR para que las libretas guardadas por un usuario permanezcan en Amazon S3, fuera del almacenamiento efímero de las instancias de clúster. EC2

Para especificar la persistencia en Amazon S3, utilice la clasificación de configuración jupyter-s3-conf al crear el clúster. Para obtener más información, consulte Configuración de aplicaciones.

Además de habilitar la persistencia de Amazon S3 utilizando la propiedad s3.persistence.enabled, debe utilizar la propiedad s3.persistence.bucket para especificar el bucket en Amazon S3 donde se guardan los cuadernos. Los blocs de notas de cada usuario se guardan en una carpeta jupyter/jupyterhub-user-name del bucket especificado. El depósito debe existir ya en Amazon S3 y la función del perfil de EC2 instancia que especifique al crear el clúster debe tener permisos para el depósito (de forma predeterminada, la función esEMR_EC2_DefaultRole). Para obtener más información, consulta Configurar IAM funciones para los EMR permisos de Amazon a los AWS servicios.

Cuando se lanza un nuevo clúster con las mismas propiedades de clasificación de configuración, los usuarios pueden abrir los blocs de notas con el contenido de la ubicación donde se guardaron.

Tenga en cuenta que, si importa archivos como módulos en un cuaderno con Amazon S3 activado, los archivos se subirán a Amazon S3. Cuando importa archivos sin habilitar la persistencia de Amazon S3, estos se cargan en su JupyterHub contenedor.

En el siguiente ejemplo, se habilita la persistencia de Amazon S3. Los blocs de notas guardados por los usuarios se almacenan en la carpeta s3://MyJupyterBackups/jupyter/jupyterhub-user-name de cada usuario, donde jupyterhub-user-name es un nombre de usuario, como por ejemplo diego.

[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]