Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Konfigurieren von Persistenz für Notebooks in Amazon S3
Sie können einen JupyterHub-Cluster in Amazon EMR so konfigurieren, dass von einem Benutzer gespeicherte Notebooks in Amazon S3 gespeichert bleiben, außerhalb des flüchtigen Speichers in Cluster-EC2-Instances.
Sie geben die S3-Persistenz mithilfe der jupyter-s3-conf
-Konfigurationsklassifizierung an, wenn Sie einen Cluster erstellen. Weitere Informationen
finden Sie unter Konfigurieren von Anwendungen.
Zusätzlich zur Aktivierung der S3-Persistenz mithilfe der Eigenschaft s3.persistence.enabled
geben Sie einen Bucket in Amazon S3 an, in dem Notebooks mithilfe der Eigenschaft
s3.persistence.bucket
gespeichert werden. Notebooks für jeden Benutzer werden in einem jupyter/
-Ordner im angegebenen Bucket gespeichert. Der Bucket muss bereits in Amazon S3 vorhanden
sein und die Rolle für das EC2-Instance-Profil, die Sie bei der Erstellung des Clusters
angeben, muss über Berechtigungen für den Bucket verfügen (standardmäßig ist die Rolle
jupyterhub-user-name
EMR_EC2_DefaultRole
). Weitere Informationen finden Sie unter Konfigurieren von IAM-Rollen für Amazon EMR-Berechtigungen für AWS-Services.
Wenn Sie einen neuen Cluster mit denselben Konfigurationsklassifizierungseigenschaften verwenden, können Benutzer Notebooks mit den Inhalten des Speicherorts öffnen.
Im folgenden Beispiel wird S3-Persistenz aktiviert. Von Benutzern gespeicherte Notebooks
werden im Ordner s3://MyJupyterBackups/jupyter/
der einzelnen Benutzer gespeichert. Dabei ist jupyterhub-user-name
ein Benutzername wie beispielsweise jupyterhub-user-name
diego
.
[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]