Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
AWS Batch Unterstützung für SageMaker KI-Ausbildungsjobs
In einer AWS Batch Job-Warteschlange werden eingereichte Jobs gespeichert und priorisiert, bevor sie auf Rechenressourcen ausgeführt werden. Sie können SageMaker KI-Schulungsjobs an eine Jobwarteschlange senden, um die Vorteile der von bereitgestellten Tools zur serverlosen Jobplanung und Priorisierung zu nutzen. AWS Batch
Funktionsweise
In den folgenden Schritten wird der Arbeitsablauf zur Verwendung einer AWS Batch Job-Warteschlange mit SageMaker KI-Schulungsaufträgen beschrieben. Ausführlichere Tutorials und Beispiel-Notizbücher finden Sie im Erste Schritte Abschnitt.
-
Einrichtung AWS Batch und alle erforderlichen Berechtigungen. Weitere Informationen finden Sie AWS Batch im AWS Batch Benutzerhandbuch unter Einrichtung.
-
Erstellen Sie die folgenden AWS Batch Ressourcen in der Konsole oder mithilfe von AWS CLI:
-
Serviceumgebung — Enthält Konfigurationsparameter für die Integration mit SageMaker KI.
-
SageMaker Warteschlange für KI-Schulungsjobs — Integriert sich in SageMaker KI, um Schulungsjobs einzureichen.
-
-
Konfigurieren Sie Ihre Daten und fordern Sie einen SageMaker KI-Schulungsjob an, z. B. Ihr Schulungscontainer-Image. Um einen Trainingsjob an eine AWS Batch Warteschlange zu senden, können Sie das AWS CLI AWS SDK für Python (Boto3), oder das SageMaker AI Python SDK verwenden.
-
Reichen Sie Ihre Trainingsjobs in die Job-Warteschlange ein. Sie können die folgenden Optionen verwenden, um Jobs einzureichen:
-
Verwenden Sie die AWS Batch SubmitServiceJob-API.
-
Verwenden Sie das
aws_batch
Modulaus dem SageMaker AI Python SDK. Nachdem Sie ein TrainingQueue Objekt und ein Modell-Trainingsobjekt (z. B. einen Estimator oder ModelTrainer) erstellt haben, können Sie TrainingQueue mithilfe der queue.submit()
Methode Trainingsjobs an die senden.
-
-
Nachdem Sie Jobs eingereicht haben, können Sie Ihre Job-Warteschlange und den Job-Status mit der AWS Batch Konsole, der AWS Batch DescribeServiceJobAPI oder der SageMaker DescribeTrainingJobKI-API einsehen.
Kosten und Verfügbarkeit
Detaillierte Preisinformationen zu Schulungsjobs finden Sie unter Amazon SageMaker AI-Preise
Sie können es AWS Batch für SageMaker KI-Schulungsjobs überall dort verwenden AWS-Region , wo Schulungsjobs verfügbar sind. Weitere Informationen finden Sie unter Amazon SageMaker AI-Endpunkte und Kontingente.
Um sicherzustellen, dass Sie über die erforderliche Kapazität verfügen, wenn Sie sie benötigen, können Sie flexible SageMaker AI-Trainingspläne (FTP) verwenden. Mit diesen Plänen können Sie Kapazitäten für Ihre Trainingsjobs reservieren. In Kombination mit AWS Batch den Warteschlangenfunktionen können Sie die Auslastung während der Laufzeit Ihres Plans maximieren. Weitere Informationen finden Sie unter Trainingspläne für Ihre Schulungsjobs oder HyperPod -cluster reservieren.
Erste Schritte
Ein Tutorial zum Einrichten einer AWS Batch Job-Warteschlange und zum Einreichen von SageMaker KI-Schulungsjobs finden Sie unter Erste Schritte mit AWS Batch SageMaker KI im AWS Batch Benutzerhandbuch.
Jupyter-Notebooks, die zeigen, wie das aws_batch
Modul im SageMaker AI Python SDK verwendet wird, finden Sie in den Notebook-Beispielen AWS Batch für SageMaker AI-Training-Jobs im Repository