Verwenden Sie Notebook-Instances, um Modelle zu erstellen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden Sie Notebook-Instances, um Modelle zu erstellen

Eine der besten Möglichkeiten für Machine-Learning-Experten (ML), Amazon zu nutzen, SageMaker besteht darin, ML-Modelle mithilfe von SageMaker Notebook-Instances zu trainieren und bereitzustellen. Die SageMaker Notebook-Instances helfen bei der Erstellung der Umgebung, indem sie Jupyter-Server auf Amazon Elastic Compute Cloud (Amazon EC2) initiieren und vorkonfigurierte Kernel mit den folgenden Paketen bereitstellen: das Amazon SageMaker Python SDK,, AWS Command Line Interface (AWS CLI), Conda, Pandas AWS SDK for Python (Boto3), Deep-Learning-Framework-Bibliotheken und andere Bibliotheken für Datenwissenschaft und maschinelles Lernen.

Machine Learning mit dem SageMaker Python-SDK

Verwenden Sie das SageMaker Python-SDK, um ein ML-Modell in einer SageMaker Notebook-Instanz zu trainieren, zu validieren, bereitzustellen und zu evaluieren. Die SageMaker Python-SDK-Abstraktionen AWS SDK for Python (Boto3) und SageMaker API-Operationen. Es ermöglicht Ihnen die Integration und Orchestrierung anderer AWS Services wie Amazon Simple Storage Service (Amazon S3) zum Speichern von Daten und Modellartefakten, Amazon Elastic Container Registry (ECR) für den Import und die Wartung der ML-Modelle, Amazon Elastic Compute Cloud (Amazon EC2) für Training und Inferenz.

Sie können auch SageMaker Funktionen nutzen, die Ihnen helfen, jede Phase eines vollständigen ML-Zyklus zu bewältigen: Datenkennzeichnung, Datenvorverarbeitung, Modelltraining, Modellbereitstellung, Bewertung der Prognoseleistung und Überwachung der Modellqualität in der Produktion.

Wenn Sie ein SageMaker Erstbenutzer sind, empfehlen wir Ihnen, das SageMaker Python-SDK zu verwenden, indem Sie dem end-to-end ML-Tutorial folgen. Die Open-Source-Dokumentation finden Sie im Amazon SageMaker Python SDK.

Tutorial-Übersicht

In diesem Tutorial „Erste Schritte“ erfahren Sie, wie Sie eine SageMaker Notebook-Instance erstellen, ein Jupyter-Notebook mit einem vorkonfigurierten Kernel mit der Conda-Umgebung für maschinelles Lernen öffnen und eine SageMaker Sitzung starten, um einen ML-Zyklus auszuführen. end-to-end Sie erfahren, wie Sie einen Datensatz in einem standardmäßigen Amazon S3 S3-Bucket speichern, der automatisch mit der SageMaker Sitzung gepaart wird, einen Trainingsjob eines ML-Modells an Amazon EC2 senden und das trainierte Modell für Prognosen bereitstellen, indem Sie es hosten oder Batch-Inferenzen über Amazon EC2 durchführen.

In diesem Tutorial wird explizit ein vollständiger ML-Ablauf gezeigt, bei dem das XGBoost-Modell aus dem integrierten Modellpool trainiert wird. SageMaker Sie verwenden den Datensatz der US-Volkszählung für Erwachsene und bewerten die Leistung des trainierten SageMaker XGBoost-Modells bei der Vorhersage des Einkommens von Einzelpersonen.