Überlegungen Erstellen Sie eine verwaltete Knotengruppe mit Amazon EC2 Capacity Blocks

Hilf mit, diese Seite zu verbessern

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Wenn Sie zu diesem Benutzerhandbuch beitragen möchten, wählen Sie den GitHub Link Diese Seite bearbeiten auf, der sich im rechten Bereich jeder Seite befindet.

Erstellen Sie eine verwaltete Knotengruppe mit Capacity Blocks for ML

Kapazitätsblöcke für Machine Learning (ML) ermöglichen es Ihnen, GPU-Instances zu einem zukünftigen Zeitpunkt zu reservieren, um Ihre ML-Workloads mit kurzer Dauer zu unterstützen. Weitere Informationen finden Sie unter Capacity Blocks for ML im EC2 Amazon-Benutzerhandbuch für Linux-Instances.

Überlegungen

Wichtig

Kapazitätsblöcke sind nur für bestimmte EC2 Amazon-Instance-Typen und AWS Regionen verfügbar. Informationen zur Kompatibilität finden Sie unter Voraussetzungen für das Arbeiten mit Kapazitätsblöcken im EC2 Amazon-Benutzerhandbuch für Linux-Instances.
Weitere Informationen finden Sie unter Verwenden von Kapazitätsblöcken für Machine-Learning-Workloads im Amazon EC2 Auto Scaling Scaling-Benutzerhandbuch.
Verwaltete Knotengruppen mit Kapazitätsblöcken können nur mit benutzerdefinierten Startvorlagen erstellt werden.
Wenn Sie verwaltete Knotengruppen mit Kapazitätsblöcken aktualisieren, stellen Sie sicher, dass die gewünschte Größe der Knotengruppe auf eingestellt ist0.

Erstellen Sie eine verwaltete Knotengruppe mit Amazon EC2 Capacity Blocks

Sie können Capacity Blocks mit von Amazon EKS verwalteten Knotengruppen für die Bereitstellung und Skalierung von GPU-beschleunigten Worker-Knoten verwenden. Die folgenden AWS CloudFormation Vorlagenbeispiele decken nicht alle Aspekte ab, die in Produktionsclustern benötigt werden. In der Regel benötigen Sie auch ein Bootstrapping-Skript, um den Knoten mit dem Cluster zu verbinden und ein Amazon EKS-beschleunigtes AMI anzugeben. Weitere Informationen finden Sie unter Erstellen Sie eine verwaltete Knotengruppe für Ihren Cluster.

Erstellen Sie eine Startvorlage, die für Ihre Workloads geeignet ist und mit von Amazon EKS verwalteten Knotengruppen funktioniert. Weitere Informationen finden Sie unter Passen Sie verwaltete Knoten mit Startvorlagen an.

Stellen Sie zusätzlich zu den Anforderungen in den oben genannten Verfahren sicher, dass Folgendes Folgendes LaunchTemplateData umfasst:
- InstanceMarketOptions mit der Einstellung "capacity-block" für MarketType
- CapacityReservationSpecification: CapacityReservationTargetmit CapacityReservationId Einstellung auf den Capacity-Block (zum Beispiel:cr-02168da1478b509e0)
- InstanceTypeauf einen Instance-Typ gesetzt, der Capacity-Blöcke unterstützt (zum Beispiel:p5.48xlarge)
  
  Im Folgenden finden Sie einen Auszug aus einer CloudFormation Vorlage, mit der eine Startvorlage für einen Kapazitätsblock erstellt wird. Um eine benutzerdefinierte AMI-verwaltete Knotengruppe zu erstellen, können Sie ImageId auch UserData Parameter hinzufügen.
```
NodeLaunchTemplate:
  Type: "AWS::EC2::LaunchTemplate"
  Properties:
    LaunchTemplateData:
      InstanceMarketOptions:
        MarketType: "capacity-block"
      CapacityReservationSpecification:
        CapacityReservationTarget:
          CapacityReservationId: "cr-02168da1478b509e0"
      InstanceType: p5.48xlarge
```
Verwenden Sie die Startvorlage, um eine verwaltete Knotengruppe zu erstellen.

Im Folgenden finden Sie ein Beispiel für den Befehl zum Erstellen einer Knotengruppe für Kapazitätsblöcke. example-valuesErsetzen Sie sie durch diejenigen, die für Ihren Cluster gelten.

Gehen Sie beim Erstellen der verwalteten Knotengruppe Capacity Block wie folgt vor:
- Legen Sie den Wert für capacity-type auf "CAPACITY_BLOCK" fest. Wenn der Kapazitätstyp nicht auf festgelegt ist "CAPACITY_BLOCK" oder einer der anderen oben genannten erforderlichen Werte für die Startvorlage fehlt, wird die Erstellungsanforderung abgelehnt.
- Achten Sie bei der Angabe subnets in der Erstellungsanforderung darauf, nur das Subnetz in derselben Availability Zone wie die Kapazitätsreservierung anzugeben.
- Wenn Sie desiredSize in der Erstellungsanforderung einen Wert ungleich Null angeben, berücksichtigt Amazon EKS dies bei der Erstellung der Auto Scaling Scaling-Gruppe (ASG). Wenn die Erstellungsanforderung jedoch gestellt wird, bevor die Kapazitätsreservierung aktiv ist, kann die ASG EC2 Amazon-Instances erst starten, wenn sie aktiv wird. Infolgedessen wird es bei ASG-Skalierungsaktivitäten zu Startfehlern kommen. Immer wenn die Reservierung aktiv wird, ist der Start der Instances erfolgreich und die ASG wird auf die bei der desiredSize Erstellung angegebene Größe hochskaliert.
```
aws eks create-nodegroup \
    --cluster-name my-cluster \
    --nodegroup-name my-mng \
    --node-role node-role-arn \
    --region region-code \
    --subnets subnet-id \
    --scaling-config minSize=node-group-min-size,maxSize=node-group-max-size,desiredSize=node-group-desired-size \
    --ami-type "AL2023_x86_64_NVIDIA" \
    --capacity-type "CAPACITY_BLOCK" \
    --launch-template id="lt-id",version=1
```
Stellen Sie sicher, dass sich die Knoten nach der Skalierung verbinden. Amazon EKS-Cluster, die verwaltete Knotengruppen mit Kapazitätsblöcken verwenden, führen keine Überprüfungen durch, ob gestartete Instances tatsächlich dem Cluster beitreten und sich dort registrieren.
Wenn Sie 0 bei der Erstellung desiredSize die Option auswählen, haben Sie verschiedene Optionen, um die Knotengruppe zu vergrößern, wenn die Kapazitätsreservierung aktiv wird:
- Erstellen Sie eine geplante Skalierungsrichtlinie für die ASG, die sich an der Startzeit der Kapazitätsblockreservierung orientiert. Weitere Informationen finden Sie unter Geplante Skalierung für Amazon EC2 Auto Scaling im Amazon EC2 Auto Scaling Scaling-Benutzerhandbuch.
- Verwenden Sie die Amazon EKS-Konsole oder eks update-nodegroup-config aktualisieren Sie die Skalierungskonfiguration und legen Sie die gewünschte Größe der Knotengruppe fest.
- Verwenden Sie den Kubernetes Cluster Autoscaler. Weitere Informationen finden Sie unter Cluster Autoscaler on. AWS
Die Knotengruppe ist jetzt bereit für die Planung von Workloads und Pods.
Damit Ihre Pods vor Ablauf der Reservierung ordnungsgemäß geleert werden können, verwendet Amazon EKS eine geplante Skalierungsrichtlinie, um die Größe der Knotengruppe auf zu reduzieren. 0 Für diese geplante Skalierung wird ein Name mit dem Titel festgelegt. Amazon EKS Node Group Capacity Scaledown Before Reservation End Wir empfehlen, diese Aktion nicht zu bearbeiten oder zu löschen.

Amazon EC2 beginnt 30 Minuten vor dem Ende der Reservierung mit dem Herunterfahren der Instances. Aus diesem Grund richtet Amazon EKS 40 Minuten vor Ende der Reservierung ein geplantes Herunterfahren der Knotengruppe ein, um Pods sicher und ordnungsgemäß zu entfernen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Kapazitätsverwaltung

Reservieren Sie GPUs für selbstverwaltete Knoten