Schritt 5. Führen Sie die Pipeline aus - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritt 5. Führen Sie die Pipeline aus

Die Pipeline ausführen.

In diesem Schritt wird die Trainings- oder Inferenzpipeline ausgeführt, die in Schritt 4 in den AWS CloudFormation Stacks erstellt wurde. Die Pipeline kann erst ausgeführt werden, wenn ihre internen Platzhalterparameter mit konkreten Werten gefüllt wurden. Diese Aktion des Zuweisens von Werten zu Platzhalterparametern ist die Hauptaktivität von Schritt 5. Zu den Platzhalterparametern gehören beispielsweise:

  • Der Speicherort von Eingabe-, Ausgabe- und Zwischendatensätzen

  • Der Amazon S3 S3-Speicherort der Runtime-Skripts und anderer Vorverarbeitungs- oder Evaluierungscodes, die in Schritt 2 entwickelt wurden (z. B. sm_submit_url für die Trainingspipeline)

  • Der Name der Region AWS

Sie müssen sicherstellen, dass diese Pfadwerte auf gültige Daten oder Code verweisen, bevor Sie die Pipeline ausführen. Wenn Sie beispielsweise den Platzhalterparameter auffüllen, der die Amazon S3 S3-URL der Python-Runtime-Skripten darstellt, müssen Sie diese Skripten an diese URL hochladen. Die Person, die die Pipeline betreibt, ist für die Konsistenzprüfung und das Hochladen von Daten verantwortlich. Personen, die die Pipeline definieren oder erstellen, müssen sich darüber keine Gedanken machen.

Je nach Reifegrad der Pipeline kann dieser Schritt automatisiert werden, sodass er regelmäßig (wöchentlich oder monatlich) ausgeführt wird. Die Automatisierung erfordert auch eine solide Überwachung, was ein wichtiger Bereich ist, der jedoch nicht in den Geltungsbereich dieses Leitfadens fällt. Für die Durchführung der Schulungspipeline wäre es angemessen, die Bewertungskennzahlen zu überwachen. Für die Inferenz-Pipeline wäre es angemessen, die Drift bei der Verteilung der Eingabedaten zu überwachen und, wenn möglich, regelmäßig Kennzeichnungen zu sammeln und die Abweichung bei der Vorhersagegenauigkeit zu messen. Diese Aufzeichnungen aus den Trainings- und Inferenzläufen sollten in einer Datenbank aufgezeichnet werden, damit sie zu einem späteren Zeitpunkt analysiert werden können.