Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender ist eine Funktion von Amazon SageMaker AI. Es reduziert die Zeit, die benötigt wird, um Modelle für maschinelles Lernen (ML) in Produktion zu bringen, indem Lasttests und Modelloptimierung für SageMaker KI-ML-Instances automatisiert werden. Sie können Inference Recommender verwenden, um Ihr Modell auf einem Endpoint- oder serverlosen Inferenzendpunkt bereitzustellen, der die beste Leistung zu den niedrigsten Kosten bietet. Inference Recommender hilft Ihnen bei der Auswahl des besten Instance-Typs und der besten Konfiguration für Ihre ML-Modelle und Workloads. Es berücksichtigt Faktoren wie die Anzahl der Instanzen, Containerparameter, Modelloptimierungen, maximale Parallelität und Speichergröße.
Amazon SageMaker Inference Recommender berechnet Ihnen nur die Instances, die Sie während der Ausführung Ihrer Jobs verwenden.
Funktionsweise
Um Amazon SageMaker Inference Recommender zu verwenden, können Sie entweder ein SageMaker KI-Modell erstellen oder ein Modell mit Ihren Modellartefakten in der SageMaker Model Registry registrieren. Verwenden Sie die AWS SDK for Python (Boto3) oder die SageMaker AI-Konsole, um Benchmarking-Jobs für verschiedene SageMaker KI-Endpunktkonfigurationen auszuführen. Inference Recommender-Jobs helfen Ihnen dabei, Kennzahlen zu Leistung und Ressourcennutzung zu sammeln und zu visualisieren, damit Sie entscheiden können, welchen Endpunkttyp und welche Konfiguration Sie wählen sollten.
Erste Schritte
Wenn Sie Amazon SageMaker Inference Recommender zum ersten Mal verwenden, empfehlen wir Ihnen, wie folgt vorzugehen:
-
Lesen Sie den Voraussetzungen für die Verwendung von Amazon SageMaker Inference Recommender Abschnitt durch, um sicherzustellen, dass Sie die Anforderungen für die Verwendung von Amazon SageMaker Inference Recommender erfüllt haben.
-
Lesen Sie sich den Empfehlungsjobs mit Amazon SageMaker Inference Recommender Abschnitt durch, um Ihre ersten Inference Recommender-Empfehlungsjobs zu starten.
-
Sehen Sie sich das einführende Beispiel für das Amazon SageMaker Inference Recommender Jupyter-Notizbuch
an, oder sehen Sie sich die Beispiel-Notebooks im folgenden Abschnitt an.
Beispiel-Notebooks
Die folgenden Beispiel-Jupyter-Notebooks können Ihnen bei den Workflows für mehrere Anwendungsfälle in Inference Recommender helfen:
-
Informationen zum Benchmarking eines HuggingFace Modells finden Sie im SageMaker Inference Recommender
für Notebooks. HuggingFace -
Wenn Sie ein XGBoost Modell vergleichen möchten, schauen Sie sich das SageMaker Inference Recommender-Notebook
an. XGBoost