Konfigurieren von Persistenz für Notebooks in Amazon S3 - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konfigurieren von Persistenz für Notebooks in Amazon S3

Sie können einen JupyterHub-Cluster in Amazon EMR so konfigurieren, dass von einem Benutzer gespeicherte Notebooks in Amazon S3 gespeichert bleiben, außerhalb des flüchtigen Speichers in Cluster-EC2-Instances.

Sie geben die S3-Persistenz mithilfe der jupyter-s3-conf-Konfigurationsklassifizierung an, wenn Sie einen Cluster erstellen. Weitere Informationen finden Sie unter Konfigurieren von Anwendungen.

Zusätzlich zur Aktivierung der S3-Persistenz mithilfe der Eigenschaft s3.persistence.enabled geben Sie einen Bucket in Amazon S3 an, in dem Notebooks mithilfe der Eigenschaft s3.persistence.bucket gespeichert werden. Notebooks für jeden Benutzer werden in einem jupyter/jupyterhub-user-name-Ordner im angegebenen Bucket gespeichert. Der Bucket muss bereits in Amazon S3 vorhanden sein und die Rolle für das EC2-Instance-Profil, die Sie bei der Erstellung des Clusters angeben, muss über Berechtigungen für den Bucket verfügen (standardmäßig ist die Rolle EMR_EC2_DefaultRole). Weitere Informationen finden Sie unter Konfigurieren von IAM-Rollen für Amazon EMR-Berechtigungen für AWS-Services.

Wenn Sie einen neuen Cluster mit denselben Konfigurationsklassifizierungseigenschaften verwenden, können Benutzer Notebooks mit den Inhalten des Speicherorts öffnen.

Im folgenden Beispiel wird S3-Persistenz aktiviert. Von Benutzern gespeicherte Notebooks werden im Ordner s3://MyJupyterBackups/jupyter/jupyterhub-user-name der einzelnen Benutzer gespeichert. Dabei ist jupyterhub-user-name ein Benutzername wie beispielsweise diego.

[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]