Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie den Amazon SageMaker Debugger zum Debuggen und Verbessern der Modellleistung
Debuggen Sie Modellausgabetensoren von Trainingsjobs für maschinelles Lernen in Echtzeit und erkennen Sie nicht konvergierende Probleme mit dem Amazon SageMaker Debugger.
Amazon SageMaker-Debugger-Funktionen
Bei einem Trainingsjob für maschinelles Lernen (ML) können Probleme auftreten, wie z. B. eine Überanpassung, gesättigte Aktivierungsfunktionen und verschwindende Farbverläufe, die die Modellleistung beeinträchtigen können.
SageMaker Debugger bietet Tools zum Debuggen von Trainingsjobs und zum Beheben solcher Probleme, um die Leistung Ihres Modells zu verbessern. Der Debugger bietet auch Tools, mit denen Warnmeldungen gesendet werden können, wenn Trainingsanomalien festgestellt werden, Maßnahmen zur Behebung der Probleme ergriffen und die Hauptursache dafür identifiziert werden können, indem gesammelte Metriken und Tensoren visualisiert werden.
SageMaker Debugger unterstützt die Frameworks Apache MXNet, PyTorch, TensorFlow und XGBoost. Weitere Informationen zu verfügbaren Frameworks und Versionen, die vom SageMaker Debugger unterstützt werden, finden Sie unter Unterstützte Frameworks und Algorithmen.
Der High-Level-Debugger-Workflow sieht wie folgt aus:
-
Ändern Sie Ihr Trainingsskript bei Bedarf mit dem
sagemaker-debugger
Python-SDK. -
Konfigurieren Sie einen SageMaker-Trainingsjob mit SageMaker Debugger.
-
Konfigurieren Sie mit der SageMaker Estimator API (für Python SDK).
-
Konfigurieren Sie mithilfe der
CreateTrainingJob
SageMaker-Anfrage (für Boto3 oder CLI) . -
Konfigurieren Sie benutzerdefinierte Trainingscontainer mit dem SageMaker Debugger.
-
-
Starten Sie einen Schulungsjob und überwachen Sie Trainingsprobleme in Echtzeit.
-
Erhalten Sie Benachrichtigungen und ergreifen Sie umgehend Maßnahmen gegen die Schulungsprobleme.
-
Empfangen Sie SMS und E-Mails und beenden Sie Trainingsjobs, wenn Schulungsprobleme festgestellt werdenIntegrierte Debuger-Aktionen für Regeln.
-
Richten Sie Ihre eigenen Aktionen mit Amazon CloudWatch Events und AWS Lambda ein.
-
-
Erkunden Sie eine eingehende Analyse der Trainingsprobleme.
-
Informationen zum Debuggen von Modellausgabetensoren finden Sie unter Visualisieren Sie Debugger-Ausgabetensoren in TensorBoard.
-
-
Beheben Sie die Probleme, berücksichtigen Sie die Vorschläge des Debuggers und wiederholen Sie die Schritte 1—5, bis Sie Ihr Modell optimiert und die Zielgenauigkeit erreicht haben.
Das SageMaker Debugger-Entwicklerhandbuch führt Sie durch die folgenden Themen.
Themen
- Unterstützte Frameworks und Algorithmen
- Amazon SageMaker-Debugger-Architektur
- Erste Schritte mit Debugger-Tutorials
- Debuggen von Schulungsaufträgen mit dem Amazon SageMaker Debugger
- Liste der in den Debugger integrierten Regeln
- Erstellen Sie benutzerdefinierte Debugger-Regeln für die Analyse von Schulungsaufträgen
- Verwenden Sie den Debugger mit benutzerdefinierten Trainingscontainern
- Konfigurieren Sie den Debugger mit der Amazon SageMaker-API
- Bewährte Methoden für Amazon SageMaker Debugger
- Erweiterte Themen und Referenzdokumentation zu Amazon SageMaker Debugger