Netzwerkmanagement - SageMaker Bewährte Methoden für die Studio-Administration

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Netzwerkmanagement

Um die SageMaker AI Studio-Domäne einzurichten, müssen Sie das VPC Netzwerk, die Subnetze und die Sicherheitsgruppen angeben. Achten Sie bei der Angabe der Subnetze VPC und darauf, dass Sie bei der Zuteilung das Nutzungsvolumen und das erwartete Wachstum IPs berücksichtigen, die in den folgenden Abschnitten erörtert werden.

VPCNetzwerkplanung

VPCKundensubnetze, die der SageMaker AI Studio-Domäne zugeordnet sind, müssen mit dem entsprechenden Classless Inter-Domain Routing (CIDR) -Bereich erstellt werden. Dies hängt von den folgenden Faktoren ab:

  • Anzahl der Benutzer.

  • Anzahl der Apps pro Benutzer.

  • Anzahl der eindeutigen Instanztypen pro Benutzer.

  • Durchschnittliche Anzahl von Trainingsinstanzen pro Benutzer.

  • Erwartetes Wachstum in%

SageMaker KI und teilnehmende AWS Dienste fügen elastische Netzwerkschnittstellen (ENI) für die folgenden Anwendungsfälle in das VPC Kundensubnetz ein:

  • Amazon EFS fügt ein ENI für ein EFS Mount-Ziel für die SageMaker AI-Domain ein (eine IP pro Subnetz/Availability Zone, die an die SageMaker AI-Domain angehängt ist).

  • SageMaker AI Studio fügt ENI für jede einzelne Instanz, die von einem Benutzerprofil oder einem gemeinsam genutzten Bereich verwendet wird, eine ein. Beispielsweise:

    • Wenn ein Benutzerprofil eine standardmäßige Jupyter-Server-App (eine „System“ -Instanz), eine Data Science-App und eine Basis-Python-App (beide auf einer ml.t3.medium Instanz ausgeführt) ausführt, injiziert Studio zwei IP-Adressen.

    • Wenn ein Benutzerprofil eine standardmäßige Jupyter-Server-App (eine „System“ -Instanz), eine GPUTensorflow-App (auf einer ml.g4dn.xlarge Instanz) und eine Data Wrangler-App (auf einer ml.m5.4xlarge Instanz) ausführt, injiziert Studio drei IP-Adressen.

  • ENIFür jeden VPC Endpunkt in VPC Domain-Subnetzen/Availability Zones wird eine eingefügt (vier IPs für SageMaker VPC KI-Endpunkte; IPs ~sechs für teilnehmende Dienstendpunkte wie S3, und.) VPC ECR CloudWatch

  • Wenn SageMaker KI-Schulungs- und Verarbeitungsjobs mit derselben VPC Konfiguration gestartet werden, benötigt jeder Job zwei IP-Adressen pro Instanz.

Anmerkung

VPCEinstellungen für SageMaker AI Studio, wie Subnetze und VPC reiner Datenverkehr, werden nicht automatisch an die in AI Studio erstellten Schulungs- und Verarbeitungsaufträge weitergegeben. SageMaker Der Benutzer muss die VPC Einstellungen und die Netzwerkisolierung nach Bedarf einrichten, wenn er den APIs Create*Job aufruft. Weitere Informationen finden Sie unter Trainings- und Inferenzcontainer im internetfreien Modus ausführen.

Szenario: Data Scientist führt Experimente mit zwei verschiedenen Instance-Typen durch

Gehen Sie in diesem Szenario davon aus, dass eine SageMaker KI-Domäne im Modus „VPCNur Verkehr“ eingerichtet ist. Es sind VPC Endpunkte wie SageMaker KI, SageMaker AI RuntimeAPI, Amazon S3 und Amazon ECR eingerichtet.

Ein Datenwissenschaftler führt Experimente mit Studio-Notebooks durch, die auf zwei verschiedenen Instance-Typen (z. B. ml.t3.medium undml.m5.large) ausgeführt werden, und startet zwei Apps in jedem Instance-Typ.

Nehmen wir an, der Datenwissenschaftler führt gleichzeitig einen Trainingsjob mit derselben VPC Konfiguration auf einer ml.m5.4xlarge Instanz aus.

In diesem Szenario wird der SageMaker AI Studio-Dienst ENIs wie folgt injiziert:

Tabelle 1 — Dem Kunden VPC für ein Experimentationsszenario ENIs eingespeist

Entität

Ziel

ENIeingespritzt

Hinweise

Level

EFSZiel montieren

VPCSubnetze

Drei

Drei AZs /Subnetze

Domain

VPC-Endpunkte

VPCSubnetze

30

Drei AZs /Subnetze mit jeweils 10 VPCE

Domain

Jupyter Server

VPC-Subnetz

One

Eine IP pro Instanz

Benutzer

KernelGateway App

VPC-Subnetz

Zwei

Eine IP pro Instanztyp

Benutzer

Training

VPC-Subnetz

Zwei

Zwei IPs pro Trainingsinstanz

Fünf IPs pro Trainingsinstanz, falls EFAverwendet

Benutzer

In diesem Szenario werden insgesamt 38 vom Kunden IPs konsumiert, VPC wobei 33 davon IPs von allen Benutzern auf Domänenebene und fünf auf Benutzerebene genutzt IPs werden. Wenn Sie 100 Benutzer mit ähnlichen Benutzerprofilen in dieser Domäne haben, die diese Aktivitäten gleichzeitig ausführen, verbrauchen Sie fünf x 100 = 500 IPs auf Benutzerebene, zusätzlich zum IP-Verbrauch auf Domänenebene, der 11 IPs pro Subnetz beträgt, also insgesamt 511. IPs Für dieses Szenario müssen Sie das VPC Subnetz CIDR mit /22 erstellen, das 1024 IP-Adressen zuweist, sodass weitere Optionen zur Verfügung stehen.

VPCNetzwerkoptionen

Eine SageMaker AI Studio-Domain unterstützt die Konfiguration des VPC Netzwerks mit einer der folgenden Optionen:

  • Nur öffentliches Internet

  • Nur VPC

Mit der Option „Nur öffentliches Internet“ können SageMaker API KI-Dienste das öffentliche Internet über das Internet-Gateway nutzenVPC, das im vom SageMaker AI-Dienstkonto verwalteten Internet-Gateway bereitgestellt wird, wie in der folgenden Abbildung dargestellt:

Standardmodus: Internetzugang über ein SageMaker AI-Dienstkonto.

Standardmodus: Internetzugang über ein SageMaker AI-Servicekonto

Die VPCeinzige Option deaktiviert das Internet-Routing über das von der SageMaker KI VPC verwaltete Dienstkonto und ermöglicht es dem Kunden, den Datenverkehr so zu konfigurieren, dass er über VPC Endpunkte geleitet wird, wie in der folgenden Abbildung dargestellt:

VPCeinziger Modus: Kein Internetzugang über ein SageMaker AI-Servicekonto.

VPCeinziger Modus: Kein Internetzugang über ein SageMaker AI-Servicekonto

Richten Sie für eine Domain, die im Modus „VPCNur“ eingerichtet ist, eine Sicherheitsgruppe pro Benutzerprofil ein, um eine vollständige Isolierung der zugrunde liegenden Instanzen zu gewährleisten. Jede Domäne in einem AWS Konto kann ihre eigene VPC Konfiguration und ihren eigenen Internetmodus haben. Weitere Informationen zur Einrichtung der VPC Netzwerkkonfiguration finden Sie unter Connect von SageMaker AI Studio-Notebooks in a VPC mit externen Ressourcen.

Einschränkungen

  • Nachdem eine SageMaker AI Studio-Domäne erstellt wurde, können Sie der Domäne keine neuen Subnetze zuordnen.

  • Der VPC Netzwerktyp (nur öffentliches Internet oder VPC nur) kann nicht geändert werden.