Configuration de la persistance pour les blocs-notes dans Amazon S3

Vous pouvez configurer un JupyterHub cluster dans Amazon EMR afin que les blocs-notes enregistrés par un utilisateur soient conservés dans Amazon S3, en dehors du stockage éphémère sur les instances de cluster. EC2

Vous spécifiez une persistence Amazon S3 à l'aide de la classification de configuration jupyter-s3-conf lorsque vous créez un cluster. Pour de plus amples informations, veuillez consulter Configuration des applications.

En plus de l'activation de persistance Amazon S3 à l'aide de la propriété s3.persistence.enabled, vous devez spécifier un compartiment dans Amazon S3 où les blocs-notes sont enregistrés à l'aide de la propriété s3.persistence.bucket. Les blocs-notes de chaque utilisateur sont enregistrés dans un dossier jupyter/jupyterhub-user-name dans le compartiment spécifié. Le compartiment doit déjà exister dans Amazon S3, et le rôle du profil d' EC2 instance que vous spécifiez lors de la création du cluster doit disposer des autorisations d'accès au compartiment (par défaut, le rôle estEMR_EC2_DefaultRole). Pour plus d'informations, consultez Configurer les rôles IAM pour les autorisations AWS Amazon EMR sur les services.

Lorsque vous lancez un nouveau cluster à l'aide des mêmes propriétés de classification de configuration, les utilisateurs peuvent ouvrir des blocs-notes avec le contenu à partir de l'emplacement enregistré.

Notez que lorsque vous importez des fichiers sous forme de modules dans un bloc-notes lorsque Amazon S3 est activé, cela entraîne le chargement des fichiers sur Amazon S3. Lorsque vous importez des fichiers sans activer la persistance Amazon S3, ils sont chargés JupyterHub dans votre conteneur.

L'exemple suivant active la persistance Amazon S3. Les cahiers enregistrés par les utilisateurs sont enregistrés dans le dossier s3://MyJupyterBackups/jupyter/jupyterhub-user-name pour chaque utilisateur, où jupyterhub-user-name est un nom d'utilisateur, par exemple diego.


[
    {
        "Classification": "jupyter-s3-conf",
        "Properties": {
            "s3.persistence.enabled": "true",
            "s3.persistence.bucket": "MyJupyterBackups"
        }
    }
]

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration JupyterHub

Connexion au nœud principal et aux serveurs de bloc-notes