Auswahl einer Funktion in Amazon SageMaker Training Zusätzliche Optionen

Trainiere ein Modell mit Amazon SageMaker

Amazon SageMaker Training ist ein vollständig verwalteter Service für maschinelles Lernen (ML) SageMaker , der Ihnen hilft, eine Vielzahl von ML-Modellen effizient und in großem Maßstab zu trainieren. Der Kern von SageMaker KI-Jobs ist die Containerisierung von ML-Workloads und die Fähigkeit, Rechenressourcen zu verwalten AWS . Die SageMaker Trainingsplattform übernimmt die schwere Arbeit, die mit der Einrichtung und Verwaltung der Infrastruktur für ML-Schulungsworkloads verbunden ist. Mit SageMaker Training können Sie sich auf die Entwicklung, Schulung und Feinabstimmung Ihres Modells konzentrieren. Auf dieser Seite werden drei empfohlene Methoden für den Einstieg in das Training eines Modells vorgestellt SageMaker, gefolgt von weiteren Optionen, die Sie in Betracht ziehen können.

Tipp

Informationen zu Trainingsgrundmodellen für generative KI finden Sie unter Verwenden von SageMaker JumpStart Basismodellen in Amazon SageMaker Studio.

Auswahl einer Funktion in Amazon SageMaker Training

Es gibt drei Hauptanwendungsfälle für das Training von ML-Modellen innerhalb von SageMaker KI. In diesem Abschnitt werden diese Anwendungsfälle sowie die SageMaker KI-Funktionen beschrieben, die wir für jeden Anwendungsfall empfehlen.

Ganz gleich, ob Sie komplexe Deep-Learning-Modelle trainieren oder kleinere Algorithmen für maschinelles Lernen implementieren, SageMaker Training bietet optimierte und kostengünstige Lösungen, die den Anforderungen Ihrer Anwendungsfälle entsprechen.

Anwendungsfälle

Im Folgenden sind die wichtigsten Anwendungsfälle für das Training von ML-Modellen innerhalb von SageMaker KI aufgeführt.

Anwendungsfall 1: Entwickeln Sie ein Modell für maschinelles Lernen in einer Low-Code- oder No-Code-Umgebung.
Anwendungsfall 2: Verwenden Sie Code, um Modelle für maschinelles Lernen mit mehr Flexibilität und Kontrolle zu entwickeln.
Anwendungsfall 3: Entwickeln Sie Modelle für maschinelles Lernen in großem Maßstab mit maximaler Flexibilität und Kontrolle.

Empfohlene Features

In der folgenden Tabelle werden drei gängige Szenarien für das Training von ML-Modellen und die entsprechenden Optionen für den Einstieg in das SageMaker Training beschrieben.

Deskriptor	Anwendungsfall 1	Anwendungsfall 2	Anwendungsfall 3
SageMaker KI-Funktion	Erstellen Sie ein Modell mit Amazon SageMaker Canvas.	Trainieren Sie ein Modell mit einem der in SageMaker KI integrierten ML-Algorithmen wie XGBoostoder mit aufgabenspezifischen Modellen SageMaker JumpStart mit dem SageMaker Python-SDK.	Trainieren Sie ein Modell in großem Maßstab mit maximaler Flexibilität, indem Sie den Skriptmodus oder benutzerdefinierte Container in KI nutzen. SageMaker
Beschreibung	Bringen Sie Ihre Daten mit. SageMaker KI hilft bei der Erstellung von ML-Modellen und der Einrichtung der Trainingsinfrastruktur und der Ressourcen.	Bringen Sie Ihre Daten mit und wählen Sie einen der integrierten ML-Algorithmen, die von SageMaker KI bereitgestellt werden. Richten Sie die Modellhyperparameter, Ausgabemetriken und grundlegenden Infrastruktureinstellungen mithilfe des SageMaker Python-SDK ein. Die SageMaker Schulungsplattform hilft bei der Bereitstellung der Trainingsinfrastruktur und der Ressourcen.	Entwickeln Sie Ihren eigenen ML-Code und bringen Sie ihn als Skript oder als Satz von Skripten in die SageMaker KI ein. Weitere Informationen finden Sie unter Verteiltes Rechnen mit SageMaker bewährten Methoden. Darüber hinaus können Sie Ihren eigenen Docker-Container mitbringen. Die SageMaker Schulungsplattform hilft Ihnen dabei, die Trainingsinfrastruktur und die Ressourcen auf der Grundlage Ihrer benutzerdefinierten Einstellungen maßstabsgetreu bereitzustellen.
Optimiert für	UI-gesteuerte Modellentwicklung mit geringem oder keinem Code und schnellem Experimentieren mit einem Trainingsdatensatz. Wenn Sie ein benutzerdefiniertes Modell erstellen, wird automatisch ein Algorithmus auf der Grundlage Ihrer Daten ausgewählt. Erweiterte Anpassungsoptionen wie die Auswahl von Algorithmen finden Sie unter Konfigurationen für erweiterte Modellerstellung.	Training von ML-Modellen mit umfassender Anpassung für Hyperparameter und Infrastruktureinstellungen und der Möglichkeit, ML-Frameworks und Einstiegsskripte für mehr Flexibilität direkt zu verwenden. Verwenden Sie integrierte Algorithmen, vortrainierte Modelle und JumpStart Modelle über das Amazon SageMaker Python SDK, um ML-Modelle zu entwickeln. Weitere Informationen finden Sie unter Low-Code-Bereitstellung mit der JumpStart Klasse.	Workloads für ML-Trainings in großem Maßstab, die mehrere Instanzen und maximale Flexibilität erfordern. Erfahren Sie mehr über verteiltes Rechnen mit SageMaker Best Practices. SageMaker KI verwendet Docker-Images, um das Training und die Bereitstellung aller Modelle zu hosten. Sie können jede SageMaker KI oder externe Algorithmen verwenden und Docker-Container verwenden, um Modelle zu erstellen.
Überlegungen	Minimale Flexibilität bei der Anpassung des von Amazon SageMaker Canvas bereitgestellten Modells.	Das SageMaker Python-SDK bietet im Vergleich zur SageMaker Low-Level-Training-API eine vereinfachte Oberfläche und weniger Konfigurationsoptionen.	Erfordert Kenntnisse der AWS Infrastruktur und der verteilten Schulungsoptionen. Siehe auch Erstellen Sie Ihren eigenen Schulungscontainer mit dem SageMaker Schulungs-Toolkit.
Empfohlene Umgebung	Verwenden Sie Amazon SageMaker Canvas. Informationen zur Einrichtung finden Sie unter Erste Schritte mit der Verwendung von SageMaker Canvas.	Verwenden Sie SageMaker KI JupyterLab in Amazon SageMaker Studio. Informationen zur Einrichtung finden Sie unter Amazon SageMaker Studio starten.	Verwendung SageMaker JupyterLabinnerhalb von Amazon SageMaker Studio. Informationen zur Einrichtung finden Sie unter Amazon SageMaker Studio starten.

Zusätzliche Optionen

SageMaker KI bietet die folgenden zusätzlichen Optionen für das Training von ML-Modellen.

SageMaker KI-Funktionen bieten Trainingsmöglichkeiten

SageMaker JumpStart: SageMaker JumpStart bietet Zugriff auf den öffentlichen SageMaker KI-Modell-Hub, der die neuesten öffentlich verfügbaren und proprietären Basismodelle enthält (FMs). Sie können diese Modelle in Amazon SageMaker Studio optimieren, evaluieren und bereitstellen. SageMaker JumpStart optimiert den Prozess der Nutzung von Basismodellen für Ihre generativen KI-Anwendungsfälle und ermöglicht es Ihnen, private Modell-Hubs für die Verwendung von Basismodellen einzurichten und gleichzeitig die Einhaltung von Governance-Richtlinien durchzusetzen und sicherzustellen, dass Ihre Organisation nur auf genehmigte Modelle zugreifen kann. Informationen zu den ersten Schritten finden Sie unter Foundation-Modelle. SageMaker JumpStart SageMaker JumpStart
SageMaker HyperPod: SageMaker HyperPod ist ein persistenter Clusterdienst für Anwendungsfälle, die belastbare Cluster für umfangreiche Workloads im Bereich maschinelles Lernen (ML) und die Entwicklung von state-of-the-art Basismodellen (FMs) benötigen. Er beschleunigt die Entwicklung solcher Modelle, indem er den undifferenzierten Aufwand für den Aufbau und die Wartung großer Rechencluster, die von Tausenden von Beschleunigern wie AWS Trainium oder NVIDIA A100 und H100 Graphical Processing Units () angetrieben werden, überflüssig macht. GPUs Sie können Workload-Manager-Software wie Slurm on verwenden. HyperPod

Weitere Funktionen von Training SageMaker

Hyperparameter-Tuning: Diese SageMaker KI-Funktion hilft dabei, eine Reihe von Hyperparametern für ein Modell zu definieren und viele Trainingsaufgaben für einen Datensatz zu starten. Abhängig von den Hyperparameterwerten kann die Trainingsleistung des Modells variieren. Diese Funktion bietet den Satz von Hyperparametern mit der besten Leistung innerhalb des angegebenen Bereichs von Hyperparametern, den Sie für die Suche festgelegt haben.
Verteiltes Training: Mit PyTorch NVIDIA CUDA und anderen Frameworks erstellten FMs Frameworks können Sie vorab trainieren oder eine Feinabstimmung vornehmen. PyTorch Um GPU-Instanzen effizient zu nutzen, verwenden Sie die verteilten SageMaker KI-Schulungsbibliotheken, die kollektive Kommunikationsoperationen und verschiedene Techniken zur Modellparallelität wie Expertenparallelität und gemeinsame Datenparallelität anbieten, die für die Infrastruktur optimiert sind. AWS
Funktionen zur Beobachtbarkeit: Nutzen Sie die Profilerstellungs- und Debugging-Funktionen von SageMaker Training, um Einblicke in die Workloads des Modelltrainings, die Modellleistung und die Ressourcennutzung zu gewinnen. Weitere Informationen finden Sie unter Debuggen und Verbessern der Modellleistung und Profilieren und Optimieren der Rechenleistung.
Kostensparende und effiziente Instanzoptionen: Verwenden Sie Heterogene Cluster, Managed Spot-Instances oder Managed Warm Pools, um die Rechenkosten und die Effizienz für die Bereitstellung von Trainingsinstanzen zu optimieren.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Modelltrainings

Arten von Algorithmen