Configuration de la persistance pour les blocs-notes dans Amazon S3 - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de la persistance pour les blocs-notes dans Amazon S3

Vous pouvez configurer un JupyterHub cluster dans Amazon EMR afin que les blocs-notes enregistrés par un utilisateur soient conservés dans Amazon S3, en dehors du stockage éphémère sur les instances de cluster. EC2

Vous spécifiez une persistence Amazon S3 à l'aide de la classification de configuration jupyter-s3-conf lorsque vous créez un cluster. Pour plus d’informations, consultez Configuration des applications.

En plus de l'activation de persistance Amazon S3 à l'aide de la propriété s3.persistence.enabled, vous devez spécifier un compartiment dans Amazon S3 où les blocs-notes sont enregistrés à l'aide de la propriété s3.persistence.bucket. Les blocs-notes de chaque utilisateur sont enregistrés dans un dossier jupyter/jupyterhub-user-name dans le compartiment spécifié. Le compartiment doit déjà exister dans Amazon S3, et le rôle du profil d'EC2instance que vous spécifiez lors de la création du cluster doit disposer des autorisations d'accès au compartiment (par défaut, le rôle estEMR_EC2_DefaultRole). Pour plus d'informations, consultez Configurer IAM les rôles pour les EMR autorisations Amazon relatives aux AWS services.

Lorsque vous lancez un nouveau cluster à l'aide des mêmes propriétés de classification de configuration, les utilisateurs peuvent ouvrir des blocs-notes avec le contenu à partir de l'emplacement enregistré.

Notez que lorsque vous importez des fichiers sous forme de modules dans un bloc-notes lorsque Amazon S3 est activé, cela entraîne le chargement des fichiers sur Amazon S3. Lorsque vous importez des fichiers sans activer la persistance Amazon S3, ils sont chargés JupyterHub dans votre conteneur.

L'exemple suivant active la persistance Amazon S3. Les cahiers enregistrés par les utilisateurs sont enregistrés dans le dossier s3://MyJupyterBackups/jupyter/jupyterhub-user-name pour chaque utilisateur, où jupyterhub-user-name est un nom d'utilisateur, par exemple diego.

[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]