Erstellen einer Notebook-Instance - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen einer Notebook-Instance

Eine SageMaker Amazon-Notebook-Instance ist eine ML-Compute-Instance, auf der die Jupyter-Notebook-App ausgeführt wird. SageMaker verwaltet die Erstellung der Instanz und der zugehörigen Ressourcen. Verwenden Sie Jupyter-Notebooks in Ihrer Notebook-Instanz, um Daten vorzubereiten und zu verarbeiten, Code zum Trainieren von Modellen zu schreiben, Modelle für das SageMaker Hosting bereitzustellen und Ihre Modelle zu testen oder zu validieren.

Um eine Notebook-Instanz zu erstellen, verwenden Sie entweder die SageMaker Konsole oder CreateNotebookInstanceAPI.

Der auszuwählende Notebook-Instance-Typ hängt von der von Ihnen beabsichtigten Verwendung Ihrer Notebook-Instance ab. Sie möchten sicherstellen, dass Ihre Notebook-Instance nicht an Arbeitsspeicher, CPU oder E/A gebunden ist. Wenn Sie ein Dataset zur Erkundung oder Vorverarbeitung in den Speicher der Notebook-Instance laden möchten, empfiehlt es sich, einen Instance-Typ mit ausreichend RAM-Speicher für Ihr Dataset auszuwählen. Dies würde eine Instance mit mindestens 16 GB Arbeitsspeicher (.xlarge oder größer) erfordern. Wenn Sie das Notebook für die rechenintensive Vorverarbeitung verwenden möchten, empfehlen wir Ihnen, eine rechneroptimierte Instance wie c4 oder c5 zu wählen.

Eine bewährte Methode bei der Verwendung eines SageMaker Notebooks besteht darin, die Notebook-Instance zur Orchestrierung andererAWS Dienste zu verwenden. Sie können die Notebook-Instance beispielsweise verwenden, um die Verarbeitung großer Datensätze zu verwalten, indem SieAWS Glue für ETL-Dienste (Extrahieren, Transformieren und Laden) oder Amazon EMR für das Mapping und die Datenreduzierung mithilfe von Hadoop aufrufen. Sie könnenAWS Dienste als temporäre Formen der Berechnung oder Speicherung Ihrer Daten verwenden.

Sie können Ihre Schulungs- und Testdaten mit einem Amazon S3-Bucket speichern und abrufen. Sie können es dann verwenden, SageMaker um Ihr Modell zu trainieren und zu bauen, sodass der Instanztyp Ihres Notebooks keinen Einfluss auf die Geschwindigkeit Ihres Modelltrainings und -tests hat.

Geht nach Erhalt der Anfrage wie folgt vor: SageMaker

  • Erzeugt eine Netzwerkschnittstelle — Wenn Sie die optionale VPC-Konfiguration wählen, SageMaker wird die Netzwerkschnittstelle in Ihrer VPC erstellt. Es verwendet die Subnetz-ID, die Sie in der Anfrage angeben, um zu bestimmen, in welcher Availability Zone das Subnetz erstellt werden soll. SageMaker ordnet die Sicherheitsgruppe, die Sie in der Anfrage angeben, dem Subnetz zu. Weitere Informationen finden Sie unter Eine Notebook-Instance in einer VPC mit externen Ressourcen Connect.

  • Startet eine ML-Compute-Instance —SageMaker Startet eine ML-Compute-Instance in einer SageMaker VPC. SageMaker führt die Konfigurationsaufgaben aus, die es ermöglichen, Ihre Notebook-Instance zu verwalten, und wenn Sie Ihre VPC angegeben haben, aktiviert sie den Datenverkehr zwischen Ihrer VPC und der Notebook-Instance.

  • Installiert Anaconda-Pakete und -Bibliotheken für gängige Deep-Learning-Plattformen —SageMaker installiert alle Anaconda-Pakete, die im Installationsprogramm enthalten sind. Weitere Informationen finden Sie in der Anaconda-Paketliste. SageMaker Installiert außerdem die MXNet-Deep-Learning-Bibliotheken TensorFlow und Apache.

  • Hängt ein ML-Speichervolume an —SageMaker fügt ein ML-Speichervolume an die ML-Recheninstanz an. Sie können das Volume als Arbeitsbereich verwenden, um das Trainingsdataset zu bereinigen oder Überprüfungs-, Test- oder andere Daten vorübergehend zu speichern. Für das Volume können Sie eine beliebige Größe zwischen 5 GB und 16 384 GB verwenden. Größenänderungen sind in Schritten von 1 GB möglich. Der Standardwert ist 5 GB. ML-Speichervolumes sind verschlüsselt, SageMaker sodass die Menge des verfügbaren freien Speicherplatzes auf dem Volume nicht ermittelt werden kann. Daher können Sie beim Aktualisieren einer Notebook-Instance die Volume-Größe nur erhöhen, nicht jedoch verkleinern. Wenn Sie die Größe eines verwendeten ML-Speicher-Volumes verkleinern möchten, erstellen Sie eine neue Notebook-Instance mit der gewünschten Größe.

    Nur Dateien und Daten, die im Ordner /home/ec2-user/SageMaker gespeichert sind, bleiben über Notebook-Instance-Sitzungen hinweg erhalten. Dateien und Daten, die außerhalb dieses Verzeichnisses gespeichert sind, werden überschrieben, wenn die Notebook-Instance angehalten und neu gestartet wird. Das /tmp-Verzeichnis jeder Notebook-Instanz bietet mindestens 10 GB Speicherplatz in einem Instanzspeicher. Beim Instance-Speicher handelt es sich um temporären Speicher auf Blockebene, der nicht persistent ist. SageMaker Löscht den Inhalt des Verzeichnisses, wenn die Instanz gestoppt oder neu gestartet wird. Dieser temporäre Speicher ist Teil des Root-Volumes der Notebook-Instance.

  • Kopien von Jupyter-Beispielnotizbüchern — Diese Python-Codebeispiele veranschaulichen das Modelltraining und die Durchführung von Übungen mit verschiedenen Algorithmen und Trainingsdatensätzen.

Um eine SageMaker Notebook-Instanz zu erstellen:
  1. Öffnen Sie die SageMaker Konsole unter https://console.aws.amazon.com/sagemaker/.

  2. Wählen Sie Notebook instances (Notebook-Instances) und Create notebook instance (Notebook-Instance erstellen) aus.

  3. Geben Sie auf der Seite Create notebook instance (Notebook-Instance erstellen) folgende Informationen ein:

    1. Geben Sie unter Notebook instance name (Name der Notebook-Instance) einen Namen für die Notebook-Instance ein.

    2. Wählen Sie für den Notebook-Instanztyp eine für Ihren Anwendungsfall geeignete Instanzgröße aus. Eine Liste der unterstützten Instanztypen und Kontingente finden Sie unter Amazon SageMaker Service Quotas.

    3. Wählen Sie für Elastic Inference (Elastische Inferenz), einen Inferenzbeschleunigertyp aus, der der Notebook-Instance zugeordnet werden soll, wenn Sie Inferenzen von der Notebook-Instance durchführen möchten, oder wählen Sie None (Keine) aus. Weitere Informationen zu elastischen Inferenzen finden Sie unter Verwenden von Amazon SageMaker Elastic Inference (EI) .

    4. Wählen Sie für Platform Identifier einen Plattformtyp aus, auf dem die Notebook-Instanz erstellt werden soll. Dieser Plattformtyp bestimmt das Betriebssystem und die JupyterLab Version, mit der Ihre Notebook-Instanz erstellt wird. Weitere Hinweise zum Plattformkennungstyp finden Sie unterAmazon Linux 2 im Vergleich zu Amazon Linux-Notebook-Instances. Informationen zu den JupyterLab-Versionen erhalten Sie unter JupyterLab Versionierung.

    5. (Optional) Über Additional configuration (Zusätzliche Konfiguration) können fortgeschrittene Benutzer ein Shell-Skript erstellen, das ausgeführt werden kann, wenn Sie die Instance erstellen oder starten. Dieses Skript, das als Lifecycle-Konfigurationsskript bezeichnet wird, kann verwendet werden, um die Umgebung für das Notebook festzulegen oder andere Funktionen auszuführen. Weitere Informationen finden Sie unter Anpassen einer Notebook-Instances mithilfe eines Lifecycle-Konfigurationsskripts.

    6. (Optional) Über Additional configuration (Zusätzliche Konfiguration) können Sie auch die Größe (in GB) des ML-Speichervolumes angeben, das der Notebook-Instance angefügt ist. Sie können eine Größe zwischen 5 GB und 16.384 GB in 1-GB-Schritten wählen. Sie können dieses Volume verwenden, um das Trainingsdataset zu bereinigen oder Überprüfungsdaten oder andere Daten temporär zu speichern.

    7. (Optional) Wählen Sie unter Minimale IMDS-Version eine Version aus der Dropdown-Liste aus. Wenn dieser Wert auf v1 gesetzt ist, können beide Versionen mit der Notebook-Instance verwendet werden. Wenn v2 ausgewählt ist, kann nur IMDSv2 mit der Notebook-Instance verwendet werden. Informationen zu IMDSv2 finden Sie unter Verwenden von IMDSv2.

      Anmerkung

      Ab dem 31. Oktober 2022 ändert sich die standardmäßige Mindest-IMDS-Version für SageMaker Notebook-Instances von IMDSv1 auf IMDSv2.

      Ab dem 1. Februar 2023 ist IMDSv1 nicht mehr für die Erstellung neuer Notebook-Instanzen verfügbar. Nach diesem Datum können Sie Notebook-Instanzen mit einer IMDS-Mindestversion von 2 erstellen.

    8. Wählen Sie für die IAM-Rolle entweder eine vorhandene IAM-Rolle in Ihrem Konto aus, die über die erforderlichen Berechtigungen für den Zugriff auf SageMaker Ressourcen verfügt, oder wählen Sie Neue Rolle erstellen. Wenn Sie Neue Rolle erstellen wählen, SageMaker wird eine IAM-Rolle mit dem Namen erstelltAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. DieAWS verwaltete RichtlinieAmazonSageMakerFullAccess ist der Rolle zugeordnet. Die Rolle stellt Berechtigungen bereit, die es der Notebook-Instance ermöglichen, Amazon S3 aufzurufen SageMaker .

    9. Um allen Benutzern der Notebook-Instance Root-Zugriff zu gewähren, wählen Sie für Root access (Root-Zugriff) die Option Enable (Aktivieren) aus. Wählen Sie zum Deaktivieren des Root-Zugriffs für Benutzer Disable (Deaktivieren) aus. Wenn Sie den Root-Zugriff aktivieren, erhalten alle Benutzer der Notebook-Instance Administratorrechte und können alle Dateien öffnen und bearbeiten.

    10. (Optional) Über die Option Encryption key (Verschlüsselungsschlüssel) können Sie Daten auf dem ML-Speichervolume, das der Notebook-Instance angefügt ist, mithilfe eines AWS Key Management Service-(AWS KMS-)Schlüssels verschlüsseln. Wenn Sie vertrauliche Informationen auf dem ML-Speichervolume speichern möchten, sollten Sie die Informationen verschlüsseln.

    11. (Optional) Über die Option Network (Netzwerk) können Sie Ihre Notebook-Instance in eine Virtual Private Cloud (VPC) stellen. Eine VPC bietet zusätzliche Sicherheit und schränkt den Zugriff auf Ressourcen in der VPC von Quellen außerhalb der VPC ein. Weitere Informationen zu VPCs finden Sie im Amazon VPC User Guide.

      So fügen Sie Ihre Notebook-Instance zu einer VPC hinzu:

      1. Wählen Sie die VPC und eine SubnetId.

      2. Wählen Sie unter Security Group (Sicherheitsgruppe) die Standardsicherheitsgruppe der VPC aus.

      3. Wenn Ihre Notebook-Instance über einen Internetzugang verfügen muss, aktivieren Sie den direkten Internetzugang. Wählen Sie für Direct internet access (Direkte Internetverbindung) die Option Enable (Aktivieren) aus. Es kann sein, dass Ihre Notebook-Instance mit Internetzugang weniger sicher ist. Weitere Informationen finden Sie unter Eine Notebook-Instance in einer VPC mit externen Ressourcen Connect.

    12. (Optional) Um Git-Repositorys mit der Notebook-Instance zu verknüpfen, wählen Sie ein Standard-Repository und bis zu 3 zusätzliche Repositorys. Weitere Informationen finden Sie unter Verknüpfen Sie Git-Repositorys mit SageMaker Notebook-Instanzen.

    13. Wählen Sie Create notebook instance (Notebook-Instance erstellen) aus.

      In wenigen Minuten SageMaker startet Amazon eine ML-Compute-Instance — in diesem Fall eine Notebook-Instance — und fügt ihr ein ML-Speichervolume hinzu. Die Notebook-Instance verfügt über einen vorkonfigurierten Jupyter-Notebook-Server und mehrere Anaconda-Bibliotheken. Weitere Informationen finden Sie in der CreateNotebookInstance-API.

  4. Wenn der Status der Notebook-Instance in der Konsole InService lautet, ist die Notebook-Instance einsatzbereit. Wählen Sie Open Jupyter (Jupyter öffnen) neben dem Notebook-Namen aus, um das klassische Jupyter-Dashboard zu öffnen.

    Sie können Öffnen wählen JupyterLab, um das JupyterLab Dashboard zu öffnen. Das Dashboard bietet Zugriff auf Ihre Notebook-Instance und SageMaker -Beispiel-Notebooks mit umfassenden Codebeispielen. Diese exemplarischen Vorgehensweisen zeigen, wie Sie SageMaker damit gängige Aufgaben des maschinellen Lernens ausführen können. Weitere Informationen finden Sie unter Beispiel-Notebooks. Weitere Informationen finden Sie unter Steuern Sie den Root-Zugriff auf eine SageMaker Notebook-Instanz.

    Weitere Informationen zu Jupyter-Notebooks finden Sie bei The Jupyter notebook.