Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

Erstellen eines SageMaker HyperPod -Clusters

Fokusmodus
Erstellen eines SageMaker HyperPod -Clusters - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erfahren Sie, wie Sie mithilfe der AWS CLI von Amazon EKS orchestrierte SageMaker HyperPod Cluster erstellen.

  1. Bevor Sie einen SageMaker HyperPod Cluster erstellen:

    1. Stellen Sie sicher, dass ein vorhandener Amazon EKS-Cluster aktiv ist und läuft. Detaillierte Anweisungen zur Einrichtung eines Amazon EKS-Clusters finden Sie unter Erstellen eines Amazon EKS-Clusters im Amazon EKS-Benutzerhandbuch.

    2. Installieren Sie das Helm-Diagramm wie unter beschriebenInstallieren Sie Pakete auf dem Amazon EKS-Cluster mit Helm.

  2. Bereiten Sie ein Lifecycle-Konfigurationsskript vor und laden Sie es in einen Amazon S3 S3-Bucket hoch, z. s3://amzn-s3-demo-bucket-sagemaker>/<lifecycle-script-directory>/src/ B.

    Laden Sie für einen schnellen Start das Beispielskript on_create.shaus dem AWS Home Distributed Training GitHub Repository herunter und laden Sie es in den S3-Bucket hoch. Dieses Skript richtet die Protokolldatei ein, die für CloudWatch das Sammeln von Protokollen aus Pod-Containern /var/log/provision/provisioning.log erforderlich ist. Sie können auch zusätzliche Setup-Anweisungen, eine Reihe von Setup-Skripten oder Befehle hinzufügen, die während der HyperPod Cluster-Bereitstellungsphase ausgeführt werden sollen.

    Wichtig

    Wenn Sie nur die verwalteten Buckets IAM-Rolle für SageMaker HyperPod anhängen AmazonSageMakerClusterInstanceRolePolicy, hat Ihr Cluster Zugriff auf Amazon S3 S3-Buckets mit dem spezifischen Präfix. sagemaker-

  3. Bereiten Sie eine CreateClusterAPI-Anforderungsdatei im JSON-Format vor. Geben Sie für den ARN der IAM-Rolle anExecutionRole, die Sie mit der AmazonSageMakerClusterInstanceRolePolicy aus dem Abschnitt IAM-Rolle für SageMaker HyperPod verwalteten Rolle erstellt haben.

    Anmerkung

    Stellen Sie sicher, dass Ihr SageMaker HyperPod Cluster in derselben Virtual Private Cloud (VPC) wie Ihr Amazon EKS-Cluster bereitgestellt wird. Die in der SageMaker HyperPod Cluster-Konfiguration angegebenen Subnetze und Sicherheitsgruppen müssen Netzwerkkonnektivität und Kommunikation mit dem API-Serverendpunkt des Amazon EKS-Clusters ermöglichen.

    // create_cluster.json { "ClusterName": "string", "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "s3://amzn-s3-demo-bucket-sagemaker>/<lifecycle-script-directory>/src/", "OnCreate": "on_create.sh" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "VpcConfig": { "SecurityGroupIds": ["string"], "Subnets": ["string"] }, "Tags": [{ "Key": "string", "Value": "string" }], "Orchestrator": { "Eks": { "ClusterArn": "string", } }, "NodeRecovery": "Automatic" }

    Beachten Sie bei der Konfiguration zur Erstellung eines neuen SageMaker HyperPod Clusters, der einem EKS-Cluster zugeordnet ist, Folgendes.

    • Sie können bis zu 20 Instanzgruppen unter dem InstanceGroups Parameter konfigurieren.

    • Geben Sie für Orchestator.Eks.ClusterArn den ARN des EKS-Clusters an, den Sie als Orchestrator verwenden möchten.

    • FürOnStartDeepHealthChecks, hinzufügen InstanceStress und InstanceConnectivity aktivierenUmfassende Integritätsprüfungen.

    • Geben Sie für anNodeRecovery, Automatic ob die automatische Knotenwiederherstellung aktiviert werden soll. SageMaker HyperPod ersetzt Instanzen (Knoten) oder startet sie neu, wenn der Health Monitoring Agent Probleme feststellt.

    • Für den Tags Parameter können Sie benutzerdefinierte Tags hinzufügen, um den SageMaker HyperPod Cluster als Ressource zu verwalten. AWS Sie können Ihrem Cluster auf die gleiche Weise Tags hinzufügen, wie Sie sie in anderen AWS Diensten hinzufügen, die Tagging unterstützen. Weitere Informationen zum Taggen von AWS Ressourcen im Allgemeinen finden Sie im Tagging AWS Resources User Guide.

    • Geben Sie für den VpcConfig Parameter die Informationen der VPC an, die im EKS-Cluster verwendet wird. Die Subnetze müssen privat sein.

  4. Führen Sie den Befehl create-cluster wie folgt aus.

    Wichtig

    Wenn Sie den create-cluster Befehl mit dem --cli-input-json Parameter ausführen, müssen Sie das file:// Präfix vor dem vollständigen Pfad zur JSON-Datei angeben. Dieses Präfix ist erforderlich, um sicherzustellen, dass der die Eingabe als Dateipfad AWS CLI erkennt. Das Weglassen des file:// Präfixes führt zu einem Parsing-Parameterfehler.

    aws sagemaker create-cluster \ --cli-input-json file://complete/path/to/create_cluster.json

    Dies sollte den ARN des neuen Clusters zurückgeben.

DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.