Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen einer Notebook-Instance
Eine SageMakerAmazon-Notebook-Instance ist eine ML-Compute-Instance, auf der die Jupyter Notebook App ausgeführt wird. SageMakerverwaltet die Erstellung der Instanz und der zugehörigen Ressourcen. Sie können Jupyter-Notebooks in Ihrer Notebook-Instance verwenden, um Daten vorzubereiten und zu verarbeiten, Code zum Trainieren von Modellen zu schreiben, Modelle innerhalb des SageMaker-Hostings bereitzustellen und Ihre Modelle zu testen oder zu validieren.
Zum Erstellen einer Notebook-Instance können Sie die SageMaker-Konsole oder die
CreateNotebookInstance
-API verwenden.
Der auszuwählende Notebook-Instance-Typ hängt von der von Ihnen beabsichtigten Verwendung Ihrer Notebook-Instance ab. Sie möchten sicherstellen, dass Ihre Notebook-Instance nicht an Arbeitsspeicher, CPU oder E/A gebunden ist. Wenn Sie ein Dataset zur Erkundung oder Vorverarbeitung in den Speicher der Notebook-Instance laden möchten, empfiehlt es sich, einen Instance-Typ mit ausreichend RAM-Speicher für Ihr Dataset auszuwählen. Dies würde eine Instance mit mindestens 16 GB Arbeitsspeicher (.xlarge oder größer) erfordern. Wenn Sie das Notebook für die rechenintensive Vorverarbeitung verwenden möchten, empfehlen wir Ihnen, eine rechneroptimierte Instance wie c4 oder c5 zu wählen.
Eine bewährte Methode bei der Verwendung eines SageMaker Notebooks besteht darin, die Notebook-Instanz zu verwenden, um andere AWS Dienste zu orchestrieren. Beispielsweise können Sie die Notebook-Instance verwenden, um die Verarbeitung großer Datensätze zu verwalten, indem Sie AWS Glue für ETL-Dienste (Extrahieren, Transformieren und Laden) oder Amazon EMR für die Kartierung und Datenreduzierung mithilfe von Hadoop aufrufen. Sie können AWS Dienste als vorübergehende Form der Berechnung oder Speicherung Ihrer Daten verwenden.
Sie können Ihre Schulungs- und Testdaten mit einem Amazon S3-Bucket speichern und abrufen. Anschließend können mit SageMaker Sie Ihr Modell trainieren und erstellen, sodass der Instance-Typ Ihres Notebooks keine Auswirkungen auf die Geschwindigkeit Ihrer Modellschulung und -tests haben würde.
Nach Erhalt der Anforderung führt SageMaker folgende Schritte aus:
-
Erstellt eine Netzwerkschnittstelle — Wenn Sie die optionale VPC-Konfiguration wählen, SageMaker wird die Netzwerkschnittstelle in Ihrer VPC erstellt. Es verwendet die Subnetz-ID, die Sie in der Anfrage angeben, um zu bestimmen, in welcher Availability Zone das Subnetz erstellt werden soll. SageMakerordnet die Sicherheitsgruppe, die Sie in der Anfrage angeben, dem Subnetz zu. Weitere Informationen finden Sie unter Eine Notebook-Instance in einer VPC mit externen Ressourcen verbinden.
-
Startet eine ML-Compute-Instance — SageMaker Startet eine ML-Compute-Instance in einer SageMaker VPC. SageMakerführt die Konfigurationsaufgaben aus, die es dem Unternehmen ermöglichen, Ihre Notebook-Instance zu verwalten, und wenn Sie Ihre VPC angegeben haben, aktiviert es den Datenverkehr zwischen Ihrer VPC und der Notebook-Instance.
-
Installiert Anaconda-Pakete und -Bibliotheken für gängige Deep-Learning-Plattformen — SageMaker installiert alle Anaconda-Pakete, die im Installationsprogramm enthalten sind. Weitere Informationen finden Sie in der Anaconda-Paketliste
. SageMakerInstalliert außerdem die Deep-Learning-Bibliotheken TensorFlow und die Apache MXNet Deep-Learning-Bibliotheken. -
Hängt ein ML-Speichervolume an — SageMaker fügt ein ML-Speichervolume an die ML-Recheninstanz an. Sie können das Volume als Arbeitsbereich verwenden, um das Trainingsdataset zu bereinigen oder Überprüfungs-, Test- oder andere Daten vorübergehend zu speichern. Für das Volume können Sie eine beliebige Größe zwischen 5 GB und 16 384 GB verwenden. Größenänderungen sind in Schritten von 1 GB möglich. Der Standardwert ist 5 GB. ML Speicher-Volumes sind verschlüsselt. SageMaker kann daher nicht bestimmen, wie viel freier Speicherplatz auf dem Volume vorhanden ist. Daher können Sie beim Aktualisieren einer Notebook-Instance die Volume-Größe nur erhöhen, nicht jedoch verkleinern. Wenn Sie die Größe eines verwendeten ML-Speicher-Volumes verkleinern möchten, erstellen Sie eine neue Notebook-Instance mit der gewünschten Größe.
Nur Dateien und Daten, die im Ordner
/home/ec2-user/SageMaker
gespeichert sind, bleiben über Notebook-Instance-Sitzungen hinweg erhalten. Dateien und Daten, die außerhalb dieses Verzeichnisses gespeichert sind, werden überschrieben, wenn die Notebook-Instance angehalten und neu gestartet wird. Das /tmp-Verzeichnis jeder Notebook-Instanz bietet mindestens 10 GB Speicherplatz in einem Instance-Speicher. Beim Instance-Speicher handelt es sich um temporären Speicher auf Blockebene, der nicht persistent ist. Wenn die Instance angehalten oder neu gestartet wird, löscht SageMaker die Inhalte des Verzeichnisses. Dieser temporäre Speicher ist Teil des Root-Volumes der Notebook-Instance. -
Kopiert Beispiel-Jupyter-Notizbücher — Diese Python-Codebeispiele veranschaulichen Modelltraining und Hosting-Übungen mit verschiedenen Algorithmen und Trainingsdatensätzen.
So erstellen Sie eine SageMaker-Notebook-Instance:
-
Öffnen Sie die SageMaker-Konsole unter https://console.aws.amazon.com/sagemaker/
. -
Wählen Sie Notebook instances (Notebook-Instances) und Create notebook instance (Notebook-Instance erstellen) aus.
-
Geben Sie auf der Seite Create notebook instance (Notebook-Instance erstellen) folgende Informationen ein:
-
Geben Sie unter Notebook instance name (Name der Notebook-Instance) einen Namen für die Notebook-Instance ein.
-
Wählen Sie für den Notebook-Instance-Typ eine Instance-Größe, die für Ihren Anwendungsfall geeignet ist. Eine Liste der unterstützten Instance-Typen und Kontingente finden Sie unter Amazon SageMaker Service Kontingente.
-
Wählen Sie für Elastic Inference (Elastische Inferenz), einen Inferenzbeschleunigertyp aus, der der Notebook-Instance zugeordnet werden soll, wenn Sie Inferenzen von der Notebook-Instance durchführen möchten, oder wählen Sie None (Keine) aus. Weitere Informationen zu elastischen Inferenzen finden Sie unter Verwenden Sie Amazon SageMaker Elastic Inference (EI) .
Wählen Sie für Platform Identifier einen Plattformtyp aus, auf dem die Notebook-Instanz erstellt werden soll. Dieser Plattformtyp bestimmt das Betriebssystem und die JupyterLab Version, mit der Ihre Notebook-Instanz erstellt wird. Hinweise zum Plattformkennungstyp finden Sie unterAmazon Linux 2 im Vergleich zu Amazon Linux-Notebook-Instances. Informationen zu den JupyterLab-Versionen erhalten Sie unter JupyterLabVersionierung.
-
(Optional) Über Additional configuration (Zusätzliche Konfiguration) können fortgeschrittene Benutzer ein Shell-Skript erstellen, das ausgeführt werden kann, wenn Sie die Instance erstellen oder starten. Dieses Skript, das als Lifecycle-Konfigurationsskript bezeichnet wird, kann verwendet werden, um die Umgebung für das Notebook festzulegen oder andere Funktionen auszuführen. Weitere Informationen finden Sie unter Anpassen einer Notebook-Instances mithilfe eines Lifecycle-Konfigurationsskripts.
-
(Optional) Über Additional configuration (Zusätzliche Konfiguration) können Sie auch die Größe (in GB) des ML-Speichervolumes angeben, das der Notebook-Instance angefügt ist. Sie können eine Größe zwischen 5 GB und 16.384 GB in 1-GB-Schritten wählen. Sie können dieses Volume verwenden, um das Trainingsdataset zu bereinigen oder Überprüfungsdaten oder andere Daten temporär zu speichern.
-
(Optional) Wählen Sie für IMDS-Mindestversion eine Version aus der Dropdownliste aus. Wenn dieser Wert auf v1 gesetzt ist, können beide Versionen mit der Notebook-Instanz verwendet werden. Wenn v2 ausgewählt ist, kann nur IMDSv2 mit der Notebook-Instance verwendet werden. Informationen zu IMDSv2 finden Sie unter IMDSv2 verwenden.
Anmerkung
Ab dem 31. Oktober 2022 ändert sich die standardmäßige IMDS-Mindestversion für SageMaker Notebook-Instances von IMDSv1 auf IMDSv2.
Ab dem 1. Februar 2023 ist IMDSv1 nicht mehr für die Erstellung neuer Notebook-Instanzen verfügbar. Nach diesem Datum können Sie Notebook-Instanzen mit einer IMDS-Mindestversion von 2 erstellen.
-
Wählen Sie für die IAM-Rolle entweder eine bestehende IAM-Rolle in Ihrem Konto aus, die über die erforderlichen Berechtigungen für den Zugriff auf SageMaker Ressourcen verfügt, oder wählen Sie Neue Rolle erstellen. Wenn Sie Create a new role wählen, SageMaker wird eine IAM-Rolle mit dem Namen
AmazonSageMaker-ExecutionRole-
erstellt. Die AWS verwaltete RichtlinieYYYYMMDD
THHmmSS
AmazonSageMakerFullAccess
ist der Rolle zugeordnet. Die Rolle bietet Berechtigungen, die es der Notebook-Instance ermöglichen, SageMaker und Amazon S3 aufzurufen. -
Um allen Benutzern der Notebook-Instance Root-Zugriff zu gewähren, wählen Sie für Root access (Root-Zugriff) die Option Enable (Aktivieren) aus. Wählen Sie zum Deaktivieren des Root-Zugriffs für Benutzer Disable (Deaktivieren) aus. Wenn Sie den Root-Zugriff aktivieren, erhalten alle Benutzer der Notebook-Instance Administratorrechte und können alle Dateien öffnen und bearbeiten.
-
(Optional) Über die Option Encryption key (Verschlüsselungsschlüssel) können Sie Daten auf dem ML-Speichervolume, das der Notebook-Instance angefügt ist, mithilfe eines AWS Key Management Service-(AWS KMS-)Schlüssels verschlüsseln. Wenn Sie vertrauliche Informationen auf dem ML-Speichervolume speichern möchten, sollten Sie die Informationen verschlüsseln.
-
(Optional) Über die Option Network (Netzwerk) können Sie Ihre Notebook-Instance in eine Virtual Private Cloud (VPC) stellen. Eine VPC bietet zusätzliche Sicherheit und schränkt den Zugriff auf Ressourcen in der VPC von Quellen außerhalb der VPC ein. Weitere Informationen zu VPCs finden Sie im Amazon VPC-Benutzerhandbuch.
So fügen Sie Ihre Notebook-Instance zu einer VPC hinzu:
-
Wählen Sie die VPC und eine SubnetId.
-
Wählen Sie unter Security Group (Sicherheitsgruppe) die Standardsicherheitsgruppe der VPC aus.
-
Wenn Ihre Notebook-Instance über einen Internetzugang verfügen muss, aktivieren Sie den direkten Internetzugang. Wählen Sie für Direct internet access (Direkte Internetverbindung) die Option Enable (Aktivieren) aus. Es kann sein, dass Ihre Notebook-Instance mit Internetzugang weniger sicher ist. Weitere Informationen finden Sie unter Eine Notebook-Instance in einer VPC mit externen Ressourcen verbinden.
-
-
(Optional) Um Git-Repositorys mit der Notebook-Instance zu verknüpfen, wählen Sie ein Standard-Repository und bis zu 3 zusätzliche Repositorys. Weitere Informationen finden Sie unter Verknüpfen von Git-Repositorys mit SageMaker-Notebook-Instances.
-
Wählen Sie Create notebook instance (Notebook-Instance erstellen) aus.
In wenigen Minuten SageMaker startet Amazon eine ML-Compute-Instance — in diesem Fall eine Notebook-Instance — und fügt ihr ein ML-Speichervolume hinzu. Die Notebook-Instance verfügt über einen vorkonfigurierten Jupyter-Notebook-Server und mehrere Anaconda-Bibliotheken. Weitere Informationen finden Sie in der
CreateNotebookInstance
-API.
-
-
Wenn der Status der Notebook-Instance in der Konsole
InService
lautet, ist die Notebook-Instance einsatzbereit. Wählen Sie Open Jupyter (Jupyter öffnen) neben dem Notebook-Namen aus, um das klassische Jupyter-Dashboard zu öffnen.Sie können Öffnen wählenJupyterLab, um das JupyterLab Dashboard zu öffnen. Das Dashboard bietet Zugriff auf Ihre Notebook-Instance und SageMaker-Beispiel-Notebooks mit umfassenden Codebeispielen. Außerdem zeigen diese Beispiele, wie Sie SageMaker zum Ausführen allgemeiner Machine Learning-Aufgaben verwenden. Weitere Informationen finden Sie unter Beispiel-Notebooks. Weitere Informationen finden Sie unter Steuern Sie den Root-Zugriff auf eine SageMaker Notebook-Instanz.
Weitere Informationen zu Jupyter-Notebooks finden Sie bei The Jupyter notebook
.