SageMaker Überblick über Pipelines - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker Überblick über Pipelines

Eine Amazon SageMaker Model Building Pipelines-Pipeline besteht aus einer Reihe miteinander verbundener Schritte, die mithilfe des Pipelines SDK definiert werden. Sie können Ihre Pipeline auch ohne das SDK erstellen, indem Sie das JSON-Schema der Pipeline-Definition verwenden. Diese Pipeline-Definition codiert eine Pipeline mithilfe eines gerichteten azyklischen Graphen (DAG), der als JSON-Definition exportiert werden kann. Diese DAG enthält Informationen zu den Anforderungen und Beziehungen zwischen den einzelnen Schritten Ihrer Pipeline. Die Struktur der DAG einer Pipeline wird durch die Datenabhängigkeiten zwischen den Schritten bestimmt. Diese Datenabhängigkeiten entstehen, wenn die Eigenschaften der Ausgabe eines Schritts als Eingabe an einen anderen Schritt übergeben werden. Die folgende Abbildung ist ein Beispiel für eine Pipeline-DAG:

Ein Beispiel für einen per Pipeline gesteuerten azyklischen Graphen (DAG).
Die Beispiel-DAG umfasst die folgenden Schritte:
  1. AbaloneProcess, eine Instanz des Verarbeitungsschritts, führt ein Vorverarbeitungsskript für die für das Training verwendeten Daten aus. Das Skript könnte beispielsweise fehlende Werte ausfüllen, numerische Daten normalisieren oder Daten in die Datensätze „Train“, „Validation“ und „Test“ aufteilen.

  2. AbaloneTrain, eine Instanz des Trainingsschritts, konfiguriert Hyperparameter und trainiert ein Modell anhand der vorverarbeiteten Eingabedaten.

  3. AbaloneEval, eine weitere Instanz des Verarbeitungsschritts, bewertet das Modell auf seine Genauigkeit. Dieser Schritt zeigt ein Beispiel für eine Datenabhängigkeit. In diesem Schritt wird die Testdatensatzausgabe von verwendet. AbaloneProcess

  4. AbaloneMSECondist eine Instanz eines Bedingungsschritts, der in diesem Beispiel überprüft, ob das mean-square-error Ergebnis der Modellauswertung unter einem bestimmten Grenzwert liegt. Wenn das Modell die Kriterien nicht erfüllt, wird der Pipelinelauf beendet.

  5. Der Pipelinelauf wird mit den folgenden Schritten fortgesetzt:

    1. AbaloneRegisterModel, wo ein SageMaker RegisterModelSchritt zur Registrierung des Modells als versionierte Modellpaketgruppe in der SageMaker Amazon-Modellregistrierung aufgerufen wird.

    2. AbaloneCreateModel, wobei ein SageMaker CreateModelSchritt zur Erstellung des Modells zur Vorbereitung der Batch-Transformation aufgerufen wird. In SageMaker ruft einen Transform-Schritt aufAbaloneTransform, um Modellvorhersagen für einen von Ihnen angegebenen Datensatz zu generieren.

In den folgenden Themen werden grundlegende Konzepte von SageMaker Pipelines beschrieben. Ein Tutorial, das die Implementierung dieser Konzepte beschreibt, finden Sie unter SageMaker Pipelines erstellen und verwalten.