Machine Learning mit dem SageMaker Python-SDK Tutorial-Übersicht

Verwenden Sie Notebook-Instances, um Modelle zu erstellen

Eine der besten Möglichkeiten für Machine-Learning-Experten (ML), Amazon zu nutzen, SageMaker besteht darin, ML-Modelle mithilfe von SageMaker Notebook-Instances zu trainieren und bereitzustellen. Die SageMaker Notebook-Instances helfen bei der Erstellung der Umgebung, indem sie Jupyter-Server auf Amazon Elastic Compute Cloud (Amazon EC2) initiieren und vorkonfigurierte Kernel mit den folgenden Paketen bereitstellen: das Amazon SageMaker Python SDK,, AWS Command Line Interface (AWS CLI), Conda, Pandas AWS SDK for Python (Boto3), Deep-Learning-Framework-Bibliotheken und andere Bibliotheken für Datenwissenschaft und maschinelles Lernen.

Machine Learning mit dem SageMaker Python-SDK

Verwenden Sie das SageMaker Python-SDK, um ein ML-Modell in einer SageMaker Notebook-Instanz zu trainieren, zu validieren, bereitzustellen und zu evaluieren. Die SageMaker Python-SDK-Abstraktionen AWS SDK for Python (Boto3) und SageMaker API-Operationen. Es ermöglicht Ihnen die Integration und Orchestrierung anderer AWS Services wie Amazon Simple Storage Service (Amazon S3) zum Speichern von Daten und Modellartefakten, Amazon Elastic Container Registry (ECR) für den Import und die Wartung der ML-Modelle, Amazon Elastic Compute Cloud (Amazon EC2) für Training und Inferenz.

Sie können auch SageMaker Funktionen nutzen, die Ihnen helfen, jede Phase eines vollständigen ML-Zyklus zu bewältigen: Datenkennzeichnung, Datenvorverarbeitung, Modelltraining, Modellbereitstellung, Bewertung der Prognoseleistung und Überwachung der Modellqualität in der Produktion.

Wenn Sie ein SageMaker Erstbenutzer sind, empfehlen wir Ihnen, das SageMaker Python-SDK zu verwenden, indem Sie dem end-to-end ML-Tutorial folgen. Die Open-Source-Dokumentation finden Sie im Amazon SageMaker Python SDK.

Tutorial-Übersicht

In diesem Tutorial „Erste Schritte“ erfahren Sie, wie Sie eine SageMaker Notebook-Instance erstellen, ein Jupyter-Notebook mit einem vorkonfigurierten Kernel mit der Conda-Umgebung für maschinelles Lernen öffnen und eine SageMaker Sitzung starten, um einen ML-Zyklus auszuführen. end-to-end Sie erfahren, wie Sie einen Datensatz in einem standardmäßigen Amazon S3 S3-Bucket speichern, der automatisch mit der SageMaker Sitzung gepaart wird, einen Trainingsjob eines ML-Modells an Amazon EC2 senden und das trainierte Modell für Prognosen bereitstellen, indem Sie es hosten oder Batch-Inferenzen über Amazon EC2 durchführen.

In diesem Tutorial wird explizit ein vollständiger ML-Ablauf gezeigt, bei dem das XGBoost-Modell aus dem integrierten Modellpool trainiert wird. SageMaker Sie verwenden den Datensatz der US-Volkszählung für Erwachsene und bewerten die Leistung des trainierten SageMaker XGBoost-Modells bei der Vorhersage des Einkommens von Einzelpersonen.

SageMakerXGBoost — Das XGBoost-Modell ist an die Umgebung angepasst und als Docker-Container vorkonfiguriert. SageMaker SageMakerbietet eine Suite integrierter Algorithmen, die für die Verwendung von Funktionen vorbereitet sind. SageMaker Weitere Informationen darüber, wofür ML-Algorithmen angepasst sind SageMaker, finden Sie unter Wählen Sie einen Algorithmus und verwenden Sie die von Amazon SageMaker integrierten Algorithmen. Informationen zu den SageMaker integrierten Algorithmus-API-Operationen finden Sie unter Erstanbieter-Algorithmen im Amazon SageMaker Python SDK.
Datensatz zur Volkszählung von Erwachsenen – Der Datensatz aus der Datenbank des Census Bureau von 1994 von Ronny Kohavi und Barry Becker (Data Mining and Visualization, Silicon Graphics). Das SageMaker XGBoost-Modell wird anhand dieses Datensatzes trainiert, um vorherzusagen, ob eine Person mehr als 50.000$ pro Jahr oder weniger verdient.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

SageMaker Notebook-Instanzen

Schritt 1: Erstellen Sie eine Amazon SageMaker Notebook-Instance für das Tutorial