Benutzerhandbuch - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerhandbuch

In diesem Abschnitt wird beschrieben, wie Datenwissenschaftler und Dateningenieure einen Amazon EMR-Cluster von Studio oder Studio Classic aus starten, ermitteln, eine Verbindung zu ihm herstellen oder ihn beenden können.

Bevor Benutzer Cluster auflisten oder starten können, müssen Administratoren die erforderlichen Einstellungen in der Studio-Umgebung konfiguriert haben. Informationen darüber, wie Administratoren eine Studio-Umgebung so konfigurieren können, dass sie die Selbstbereitstellung und die Auflistung von Amazon EMR-Clustern ermöglicht, finden Sie unter. Admin-Leitfaden

Unterstützte Images und Kernel für die Verbindung zu einem Amazon EMR-Cluster von Studio oder Studio Classic

Die folgenden Images und Kernel enthalten die JupyterLab Erweiterung sagemaker-studio-analytics-extension, die mithilfe von Apache Livy über die SparkMagicBibliothek eine Verbindung zu einem Remote-Spark-Cluster (Amazon EMR) herstellt.

  • Für Studio-Benutzer: SageMaker Distribution ist eine Docker-Umgebung für Data Science, die als Standard-Image für Notebook-Instances verwendet wird. JupyterLab Alle Versionen von SageMakerDistribution sind sagemaker-studio-analytics-extension vorinstalliert.

  • Für Studio Classic-Benutzer: Die folgenden Images sind vorinstalliert mit: sagemaker-studio-analytics-extension

    • DataScience — Python-3-Kernel

    • DataScience 2.0 — Python-3-Kernel

    • DataScience 3.0 — Python-3-Kernel

    • SparkAnalytics 1.0 — SparkMagic und PySpark Kernel

    • SparkAnalytics 2.0 — SparkMagic und Kernel PySpark

    • SparkMagic — SparkMagic und Kernel PySpark

    • PyTorch 1.8 — Python-3-Kernel

    • TensorFlow 2.6 — Python-3-Kernel

    • TensorFlow 2.11 — Python-3-Kernel

Um über ein anderes integriertes oder Ihr eigenes Image eine Verbindung zu Amazon EMR-Clustern herzustellen, folgen Sie den Anweisungen unter Bring Your Own Image.

Bring Your Own Image

Um Ihr eigenes Image in Studio oder Studio Classic zu integrieren und es Ihren Notebooks zu ermöglichen, sich mit Amazon EMR-Clustern zu verbinden, installieren Sie die folgende sagemaker-studio-analytics-extensionErweiterung in Ihrem Kernel. Es unterstützt die Verbindung von SageMaker Studio- oder Studio Classic-Notebooks mit Spark-Clustern (Amazon EMR) über die SparkMagicBibliothek.

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Um mit Kerberos-Authentifizierung eine Verbindung zu Amazon EMR herzustellen, müssen Sie außerdem den Kinit-Client installieren. Je nach Betriebssystem kann der Befehl zur Installation des Kinit-Clients unterschiedlich sein. Verwenden Sie den Befehl apt-get install -y -qq krb5-user, um ein Ubuntu-Image (auf Basis von Debian) mitzubringen.

Weitere Informationen zum Mitbringen Ihres eigenen Images in SageMaker Studio oder Studio Classic finden Sie unter Bringen Sie Ihr eigenes SageMaker Bild mit.