Trainieren eines Modells mit Amazon SageMaker - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Trainieren eines Modells mit Amazon SageMaker

Das folgende Diagramm zeigt, wie Sie ein Modell mit Amazon trainieren und bereitstellen SageMaker. Ihr Schulungscode greift auf Ihre Schulungsdaten zu und gibt Modellartefakte aus einem S3-Bucket aus. Anschließend können Sie Anfragen an einen Modellendpunkt stellen, um Inferenzen auszuführen. Sie können sowohl das Schulungs- als auch das Inferenzcontainer-Image in einer Amazon Elastic Container Registry (ECR) speichern.


            Ihr Code interagiert während der Schulung und der Bereitstellung des Modells mit einem S3-Bucket, einem Endpunkt und einem ECR.

Der folgende Leitfaden hebt zwei Komponenten von hervor SageMaker: Modelltraining und Modellbereitstellung.

Um ein Modell in zu trainieren SageMaker, erstellen Sie einen Trainingsauftrag. Der Schulungsauftrag enthält die folgenden Informationen:

  • Der URL des Amazon Simple Storage Service (Amazon S3)-Bucket, in dem die Daten gespeichert wurden.

  • Die Rechenressourcen, die Sie für SageMaker das Modelltraining verwenden möchten. Rechenressourcen sind Machine Learning (ML)-Compute-Instances, die von verwaltet werden SageMaker.

  • Die URL des S3-Buckets, in dem die Ausgabe des Schulungsauftrags gespeichert werden soll.

  • Der Amazon Elastic Container Registry-Pfad, in dem der Schulungscode gespeichert ist. Weitere Informationen finden Sie unter Docker-Registrierungspfade und Beispielcode.

Anmerkung

Ihr Eingabedatensatz muss sich in derselben AWS-Region wie Ihr Schulungsauftrag befinden.

Bei einem Schulungsalgorithmus können Sie aus folgenden Optionen auswählen:

Nachdem Sie den Trainingsauftrag erstellt haben, SageMaker startet die ML-Compute-Instances und verwendet den Trainingscode und den Trainingsdatensatz, um das Modell zu trainieren. Die resultierenden Modellartefakte und andere Ausgaben werden in dem S3-Bucket gespeichert, den Sie dafür angegeben haben.

Sie können einen Trainingsauftrag mit der SageMaker Konsole oder der API erstellen. Informationen zum Erstellen eines Schulungsauftrags mit der API finden Sie in der CreateTrainingJob-API.

Wenn Sie einen Trainingsauftrag mit der API erstellen, SageMaker repliziert standardmäßig den gesamten Datensatz auf ML-Compute-Instances. Um eine Teilmenge der Daten auf jeder ML-Compute-Instance SageMaker replizieren zu lassen, müssen Sie das S3DataDistributionType Feld auf setzenShardedByS3Key. Sie können dieses Feld mithilfe des Low-Level-SDKs festlegen. Weitere Informationen finden Sie unter S3DataDistributionType in S3DataSource.

Wichtig

Um zu verhindern, dass Ihr Algorithmus-Container um Arbeitsspeicher konkurriert, reservieren wir Arbeitsspeicher für unsere SageMaker kritischen Systemprozesse auf Ihren ML-Compute-Instances und Sie können daher nicht erwarten, dass der gesamte Arbeitsspeicher für Ihren Instance-Typ angezeigt wird.