Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Automatische Skalierung von SageMaker Amazon-Modellen
Amazon SageMaker unterstützt automatische Skalierung (Auto Scaling) für Ihre gehosteten Modelle. Auto Scaling passt dynamisch die Anzahl der Instances an, die für ein Modell als Reaktion auf Workload-Änderungen zur Verfügung gestellt werden. Wenn die Arbeitslast steigt, bringt die automatische Skalierung mehr Instances online. Wenn die Arbeitslast sinkt, werden durch die automatische Skalierung unnötige Instances entfernt, so dass Sie nicht für bereitgestellte Instances zahlen, die Sie nicht nutzen.
Themen
- Überblick über Auto-Scaling-Richtlinien
- Voraussetzungen für die automatische Skalierung
- Konfigurieren Sie Auto Scaling für Modelle über die Konsole
- Registrieren eines Modells
- Definieren einer Skalierungsrichtlinie
- Anwenden einer Skalierungsrichtlinie
- Anweisungen zum Bearbeiten einer Skalierungsrichtlinie
- Deaktivieren Sie vorübergehend die Skalierungsrichtlinien
- Löschen einer Skalierungsrichtlinie
- Überprüfen Sie den Status einer Skalierungsaktivität, indem Sie die Skalierungsaktivitäten beschreiben
- Lasttest Ihrer Auto -Scaling-Konfiguration
- Wird verwendet AWS CloudFormation , um eine Skalierungsrichtlinie zu erstellen
- Endpunkte aktualisieren, die Auto Scaling verwenden
- Löschen Sie Endpunkte, die für Auto Scaling konfiguriert sind