Beispiel-Notebooks für Amazon SageMaker Autopilot - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beispiel-Notebooks für Amazon SageMaker Autopilot

Die folgenden Notebooks dienen als praktische Beispiele für verschiedene Anwendungsfälle von Autopilot.

Sie finden alle Notebooks von Autopilot im autopilot Repository SageMaker GitHub mit Beispielen.

Wir empfehlen, das vollständige Git-Repository in Studio Classic zu klonen, um direkt auf die Notebooks zuzugreifen und sie auszuführen. Informationen zum Klonen eines Git-Repositorys in Studio Classic finden Sie unter Klonen Sie ein Git-Repository in SageMaker Studio Classic.

Anwendungsfall Beschreibung
Serverlose Inferenz

Standardmäßig ermöglicht Autopilot die Bereitstellung generierter Modelle für Inferenzendpunkte in Echtzeit. In diesem Repository wird in diesem Notebook veranschaulicht, wie Autopilot-Modelle, die mit ENSEMBLING und HYPERPARAMETER OPTIMIZATION (HPO) Modi trainiert wurden, auf serverlosen Endpunkten eingesetzt werden können. Serverlose Endgeräte starten automatisch Rechenressourcen und skalieren sie je nach Datenverkehr ein- und auswärts, sodass Sie keine Instance-Typen auswählen oder Skalierungsrichtlinien verwalten müssen.

Auswahl benutzerdefinierter Funktionen

Der Autopilot überprüft Ihren Datensatz und führt eine Reihe von Kandidaten durch, um die optimale Kombination aus Datenvorverarbeitungsschritten, Algorithmen für Machine Learning und Hyperparametern zu ermitteln. Sie können die Lösung problemlos entweder auf einem Echtzeit-Endpunkt oder für die Batch-Verarbeitung bereitstellen.

In einigen Fällen ist es möglicherweise erforderlich, benutzerdefinierten Datenverarbeitungscode für Autopilot bereitzustellen. Beispielsweise könnten Ihre Datensätze eine große Anzahl unabhängiger Variablen enthalten, und Sie möchten möglicherweise zuerst einen Schritt zur benutzerdefinierten Feature-Auswahl einbauen, um irrelevante Variablen zu entfernen. Der resultierende kleinere Datensatz kann dann verwendet werden, um einen Autopilotauftrag zu starten. Letztlich sollten Sie auch sowohl den benutzerdefinierten Verarbeitungscode als auch Modelle von Autopilot für die Echtzeit- oder Batch-Verarbeitung einbeziehen.

Beispiel für eine Pipeline

Während Autopilot den Prozess der Erstellung von ML-Modellen optimiert, sind MLOps-Ingenieure weiterhin für die Erstellung, Automatisierung und Verwaltung von end-to-end ML-Workflows in der Produktion verantwortlich. SageMaker Pipelines können bei der Automatisierung verschiedener Schritte des ML-Lebenszyklus helfen, z. B. Datenvorverarbeitung, Modelltraining, Hyperparameteroptimierung, Modellbewertung und Bereitstellung. Dieses Notebook zeigt, wie Autopilot in einen SageMaker Pipelines- end-to-end AutoML-Trainingsworkflow integriert wird. Um ein Autopilot-Experiment in Pipelines zu starten, müssen Sie einen Workflow zur Modellerstellung erstellen, indem Sie mithilfe von Pipelines Lambda oder Prozessiereung Steps benutzerdefinierten Integrationscode schreiben. Weitere Informationen finden Sie unter Verschieben von Amazon- SageMaker Autopilot-ML-Modellen von Experimenten in die Produktion mithilfe von Amazon SageMaker Pipelines.

Wenn Sie Autopilot im Ensembling-Modus verwenden, können Sie alternativ auf das Notebook-Beispiel verweisen, das zeigt, wie der native AutoML-Schritt im SageMaker nativen AutoML-Schritt der Pipeline verwendet wird. Da Autopilot als systemeigener Schritt in Pipelines unterstützt wird, können Sie Ihren Pipelines jetzt einen automatisierten Schulungsschritt (AutoMLStep) hinzufügen und ein Autopilot-Experiment im Ensembling-Modus aufrufen.

Mehr Notebooks

Weitere Notebooks, die andere Anwendungsfälle wie Batch-Transformation, Zeitreihenprognosen und mehr veranschaulichen, finden Sie im Stammverzeichnis.