Metriken für die Überwachung von Amazon SageMaker AI mit Amazon CloudWatch

Fokusmodus

Metriken für die Überwachung von Amazon SageMaker AI mit Amazon CloudWatch - Amazon SageMaker KI

Kennzahlen für Endpunktaufrufe SageMaker Metriken für KI-Inferenzkomponenten Kennzahlen für Multimodell-Endpunkte Jobs und Endpunkt-Kennzahlen Inference-Recommender-Kennzahlen Ground-Truth-Kennzahlen Feature-Store-Kennzahlen Pipeline-Kennzahlen

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Sie können Amazon SageMaker AI mithilfe von Amazon überwachen. Amazon CloudWatch sammelt Rohdaten und verarbeitet sie zu lesbaren, nahezu in Echtzeit verfügbaren Metriken. Diese Statistiken werden 15 Monate lang aufbewahrt. Mit ihnen können Sie auf historische Informationen zugreifen und sich einen besseren Überblick über die Leistung Ihrer Webanwendung oder Ihres Dienstes verschaffen. Die CloudWatch Amazon-Konsole beschränkt die Suche jedoch auf Metriken, die in den letzten 2 Wochen aktualisiert wurden. Diese Einschränkung stellt sicher, dass die aktuellen Aufträge in Ihrem Namensraum aufgeführt werden.

Um Kennzahlen ohne Verwendung einer Suche grafisch darzustellen, geben Sie den exakten Namen in der Quellansicht ein. Sie können auch Alarme einrichten, die auf bestimmte Grenzwerte achten und Benachrichtigungen senden oder Aktivitäten auslösen, wenn diese Grenzwerte erreicht werden. Weitere Informationen finden Sie im CloudWatch Amazon-Benutzerhandbuch.

SageMaker KI-Metriken und -Dimensionen

SageMaker Metriken zum Aufrufen von KI-Endpunkten
SageMaker Metriken für KI-Inferenzkomponenten
SageMaker KI-Endpunktmetriken für mehrere Modelle
SageMaker KI-Jobs und Endpunktmetriken
SageMaker Kennzahlen für Jobs von Inference Recommender
SageMaker Ground Truth Truth-Metriken
Amazon SageMaker Feature Store-Metriken
SageMaker Metriken für Pipelines

SageMaker Metriken zum Aufrufen von KI-Endpunkten

Der AWS/SageMaker-Namespace enthält die folgenden Anforderungsmetriken von InvokeEndpoint-Aufrufen.

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Die folgende Abbildung zeigt, wie ein SageMaker KI-Endpunkt mit der Amazon SageMaker Runtime API interagiert. Die Gesamtzeit zwischen dem Absenden einer Anfrage an einen Endpunkt und dem Eingang einer Reaktion hängt von den folgenden drei Komponenten ab.

Netzwerklatenz — die Zeit, die zwischen dem Senden einer Anfrage an die Runtime Runtime API und dem Empfang einer Antwort von der SageMaker Runtime API vergeht.
Overhead-Latenz — die Zeit, die benötigt wird, um eine Anfrage von der SageMaker Runtime Runtime API an den Modellcontainer zu transportieren und die Antwort zurück zu transportieren.
Modelllatenz – die Zeit, die der Modell-Container braucht, um die Anfrage zu verarbeiten und eine Antwort zurückzugeben.

Eine Abbildung, die zeigt, dass die Gesamtlatenz die Summe aus Netzwerk-, Overhead- und Modell-Latenzen ist.

Weitere Informationen zur Gesamtlatenz finden Sie unter Bewährte Methoden für das Auslastungstesten von Amazon SageMaker AI-Inferenzendpunkten in Echtzeit. Informationen darüber, wie lange CloudWatch Metriken aufbewahrt werden, finden Sie GetMetricStatisticsin der Amazon CloudWatch API-Referenz.

Kennzahlen für Endpunktaufrufe

Metrik	Beschreibung
`ConcurrentRequestsPerCopy`	Die Anzahl der gleichzeitigen Anfragen, die von der Inferenzkomponente empfangen wurden, normalisiert durch jede Kopie einer Inferenzkomponente. Gültige Statistiken: Min, Max
`ConcurrentRequestsPerModel`	Die Anzahl der gleichzeitigen Anfragen, die vom Modell empfangen wurden. Gültige Statistiken: Min, Max
`Invocation4XXErrors`	Die Anzahl der `InvokeEndpoint`-Anforderungen, bei denen das Modell den HTTP-Antwortcode 4xx zurückgegeben hat. Für jede 4xx-Antwort wird der Wert 1 gesendet, andernfalls 0. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`Invocation5XXErrors`	Die Anzahl der `InvokeEndpoint`-Anforderungen, bei denen das Modell den HTTP-Antwortcode 5xx zurückgegeben hat. Für jede 5xx-Antwort wird der Wert 1 gesendet, andernfalls 0. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`InvocationModelErrors`	Die Anzahl der Modellaufrufanforderungen, die nicht zu einer 2XX-HTTP-Antwort geführt haben. Dazu gehören 4XX/5XX-Statuscodes, Socket-Fehler auf niedriger Ebene, nicht formgerechte HTTP-Antworten und Zeitüberschreitungen bei Anfragen. Für jede Antwort auf Fehler wird der Wert 1 gesendet, andernfalls 0. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`Invocations`	Die Anzahl `InvokeEndpoint`-Anfragen, die an einen Modell-Endpunkt gesendet wurden. Mit der Summenstatistik (Sum) können Sie die Gesamtanzahl der an einen Modellendpunkt gesendeten Anforderungen abrufen. Einheiten: keine Gültige Statistiken: Summe
`InvocationsPerCopy`	Die Anzahl der Aufrufe, normalisiert durch jede Kopie einer Inferenzkomponente. Gültige Statistiken: Summe
`InvocationsPerInstance`	Die Anzahl der Aufrufe, die an ein Modell gesendet wurden, jeweils normalisiert durch `InstanceCount` ProductionVariant. 1/ `numberOfInstances` wird als Wert für jede Anfrage gesendet. `numberOfInstances`ist die Anzahl der aktiven Instanzen für den Endpunkt ProductionVariant hinter dem Endpunkt zum Zeitpunkt der Anfrage. Einheiten: keine Gültige Statistiken: Summe
`ModelLatency`	Das Zeitintervall, das ein Modell benötigt, um auf eine SageMaker Runtime-API-Anfrage zu antworten. Dieses Intervall beinhaltet die lokalen Kommunikationszeiten, die zum Senden der Anfrage und zum Abrufen der Antwort aus dem Modellcontainer benötigt wurden. Es beinhaltet auch die Zeit, die benötigt wurde, um die Inferenz im Container abzuschließen. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl
`ModelSetupTime`	Die zum Starten neuer Ressourcen zur Datenverarbeitung für einen Serverless-Endpunkt erforderliche Zeit. Die Zeit kann je nach Modellgröße, Dauer zum Herunterladen des Modells und Startzeit des Containers variieren. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenzahl, Perzentile
`OverheadLatency`	Das Zeitintervall, das zu der Zeit hinzugefügt wird, die SageMaker KI-Overheads für die Beantwortung einer Kundenanfrage benötigt haben. Dieses Intervall wird von der Zeit an gemessen, in der SageMaker KI die Anfrage empfängt, bis sie eine Antwort an den Client zurücksendet, abzüglich der`ModelLatency`. Die Overhead-Latenz variiert und ist von mehreren Faktoren abhängig, einschließlich Anforderungs- und Antwortnutzlastgrößen, Anforderungshäufigkeit und Authentifizierung/Autorisierung der Anforderung. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl

Dimensionen für Kennzahlen für den Aufruf von Endpunkten

Dimension	Beschreibung
`EndpointName, VariantName`	Filtert die Kennzahlen für den Endpunktaufruf einer `ProductionVariant` für den angegebenen Endpunkt und die Variante.
`InferenceComponentName`	Filtert Metriken zum Aufruf von Inferenzkomponenten.

SageMaker Metriken für KI-Inferenzkomponenten

Der /aws/sagemaker/InferenceComponents Namespace umfasst die folgenden Metriken von Aufrufen an Endpunkte, InvokeEndpointdie Inferenzkomponenten hosten.

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Metrik	Beschreibung
`CPUUtilizationNormalized`	Der Wert der `CPUUtilizationNormalized` Metrik, die von jeder Kopie der Inferenzkomponente gemeldet wird. Der Wert liegt zwischen 0 und 100%. Wenn Sie den `NumberOfCpuCoresRequired` Parameter in den Einstellungen für die Kopie der Inferenzkomponente festlegen, stellt die Metrik die Auslastung im Vergleich zur Reservierung dar. Andernfalls stellt die Metrik die Auslastung dar, die über dem Grenzwert liegt.
`GPUMemoryUtilizationNormalized`	Der Wert der `GPUMemoryUtilizationNormalized` Metrik, der von jeder Kopie der Inferenzkomponente gemeldet wird.
`GPUUtilizationNormalized`	Der Wert der `GPUUtilizationNormalized` Metrik, der von jeder Kopie der Inferenzkomponente gemeldet wird. Wenn Sie den `NumberOfAcceleratorDevicesRequired` Parameter in den Einstellungen für die Kopie der Inferenzkomponente festlegen, stellt die Metrik die Auslastung im Vergleich zur Reservierung dar. Andernfalls stellt die Metrik die Auslastung dar, die über dem Grenzwert liegt.
`MemoryUtilizationNormalized`	Der von jeder Kopie der Inferenzkomponente `MemoryUtilizationNormalized` gemeldete Wert. Wenn Sie den `MinMemoryRequiredInMb` Parameter in den Einstellungen für die Kopie der Inferenzkomponente festlegen, stellen die Metriken die Auslastung über die Reservierung dar. Andernfalls geben die Metriken an, dass die Auslastung über dem Grenzwert liegt.

Dimensionen für Metriken für Inferenzkomponenten

Dimension	Beschreibung
`InferenceComponentName`	Filtert Metriken für Inferenzkomponenten.

SageMaker KI-Endpunktmetriken für mehrere Modelle

Der AWS/SageMaker Namespace umfasst das folgende Modell zum Laden von Metriken aus Aufrufen von. InvokeEndpoint

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Informationen darüber, wie lange CloudWatch Metriken aufbewahrt werden, finden Sie GetMetricStatisticsin der Amazon CloudWatch API-Referenz.

Kennzahlen zum Laden von Multimodell-Endpunktmodellen

Metrik	Beschreibung
`ModelLoadingWaitTime`	Das Zeitintervall, in dem eine Aufrufanforderung darauf gewartet hat, dass das Zielmodell heruntergeladen, geladen oder beides heruntergeladen wurde, um die Inferenz auszuführen. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl
`ModelUnloadingTime`	Der Zeitraum , das zum Entladen des Modells über den `UnloadModel`-API-Aufruf des Containers erforderlich war. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl
`ModelDownloadingTime`	Die Dauer, die es brauchte, das Modell von Amazon Simple Storage Service (Amazon S3) herunterzuladen. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl
`ModelLoadingTime`	Der Zeitraum , das zum Laden des Modells über den `LoadModel`-API-Aufruf des Containers erforderlich war. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl
`ModelCacheHit`	Die Anzahl der `InvokeEndpoint`-Anforderungen, die an den Multimodell-Endpunkt gesendet werden, für die das Modell bereits geladen wurde. Die Durchschnittsstatistik zeigt das Verhältnis der Anforderungen an, für die das Modell bereits geladen wurde. Einheiten: keine Gültige Statistiken: Durchschnitt, Datenstichprobe

Dimensionen für Kennzahlen zum Laden von Multimodell-Endpunktmodellen

Dimension	Beschreibung
`EndpointName, VariantName`	Filtert die Kennzahlen für den Endpunktaufruf einer `ProductionVariant` für den angegebenen Endpunkt und die Variante.

Die /aws/sagemaker/Endpoints-Namespaces enthalten die folgenden Instance-Metriken aus Aufrufen an InvokeEndpoint.

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Informationen darüber, wie lange CloudWatch Metriken aufbewahrt werden, finden Sie GetMetricStatisticsin der Amazon CloudWatch API-Referenz.

Kennzahlen für Modell-Instances von Multimodell-Endpunkten

Metrik Beschreibung

Metrik	Beschreibung
`LoadedModelCount`	Die Anzahl der Modelle, die in die Container des Multimodell-Endpunkts geladen werden. Diese Metrik wird pro Instance ausgegeben. Die Durchschnittsstatistik mit einem Zeitraum von 1 Minute gibt Ihnen die durchschnittliche Anzahl der pro Instance geladenen Modelle an. Die Summenstatistik gibt Ihnen die Gesamtzahl der Modelle an, die über alle Instances im Endpunkt geladen wurden. Die Modelle, die von dieser Metrik verfolgt werden, sind nicht unbedingt eindeutig, da ein Modell möglicherweise in mehrere Container am Endpunkt geladen wird. Einheiten: keine Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl

LoadedModelCount

Die Anzahl der Modelle, die in die Container des Multimodell-Endpunkts geladen werden. Diese Metrik wird pro Instance ausgegeben.

Die Durchschnittsstatistik mit einem Zeitraum von 1 Minute gibt Ihnen die durchschnittliche Anzahl der pro Instance geladenen Modelle an.

Die Summenstatistik gibt Ihnen die Gesamtzahl der Modelle an, die über alle Instances im Endpunkt geladen wurden.

Die Modelle, die von dieser Metrik verfolgt werden, sind nicht unbedingt eindeutig, da ein Modell möglicherweise in mehrere Container am Endpunkt geladen wird.

Einheiten: keine

Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl

Dimensionen für Kennzahlen zum Laden von Multimodell-Endpunktmodellen

Dimension	Beschreibung
`EndpointName, VariantName`	Filtert die Kennzahlen für den Endpunktaufruf einer `ProductionVariant` für den angegebenen Endpunkt und die Variante.

SageMaker KI-Jobs und Endpunktmetriken

Die /aws/sagemaker/Endpoints Namespaces /aws/sagemaker/ProcessingJobs /aws/sagemaker/TrainingJobs/aws/sagemaker/TransformJobs,, und beinhalten die folgenden Metriken für Trainingsjobs und Endpunktinstanzen.

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Anmerkung

Amazon CloudWatch unterstützt hochauflösende benutzerdefinierte Metriken und die beste Auflösung beträgt 1 Sekunde. Je feiner die Auflösung ist, desto kürzer ist jedoch die Lebensdauer der Messwerte. CloudWatch Für die Frequenzauflösung von 1 Sekunde sind die CloudWatch Messwerte 3 Stunden lang verfügbar. Weitere Informationen zur Auflösung und Lebensdauer der CloudWatch Metriken finden Sie GetMetricStatisticsin der Amazon CloudWatch API-Referenz.

Tipp

Erwägen Sie die Verwendung von Amazon Debugger, um Ihr Trainingsjob mit einer feineren Auflösung von bis zu 100 Millisekunden (0,1 Sekunden) zu profilieren und die Trainingsmetriken unbegrenzt in Amazon S3 zu speichern, um jederzeit benutzerdefinierte Analysen durchführen zu können. SageMaker SageMaker Der Debugger bietet integrierte Regeln zur automatischen Erkennung häufiger Trainingsprobleme. Er erkennt Probleme mit der Nutzung von Hardwareressourcen (wie CPU-, GPU- und I/O-Engpässe). Es erkennt auch Probleme mit Modellen, die nicht konvergieren (wie Überanpassung, verschwindende Gradienten und explodierende Tensoren). SageMaker Der Debugger bietet auch Visualisierungen über Studio Classic und seinen Profilerstellungsbericht. Weitere Informationen zu den Debugger-Visualisierungen finden Sie unter Exemplarische Vorgehensweise zum SageMaker Debugger Insights-Dashboard, Exemplarische Vorgehensweise zum Debugger-Profilerstellungsbericht und Analysieren von Daten mithilfe der Clientbibliothek. SMDebug

Verarbeitungsauftrag, Trainingsauftrag, Stapeltransformationsauftrag und Endpunkt-Instance-Kennzahlen

Kennzahl	Beschreibung
`CPUReservation`	Die Summe der von Containern auf einer Instance reservierten Daten. CPUs Der Wert liegt zwischen 0 und 100%. In den Einstellungen für eine Inferenzkomponente legen Sie die CPU-Reservierung mit dem `NumberOfCpuCoresRequired` Parameter fest. Wenn beispielsweise 4 und 2 reserviert sind CPUs, beträgt die `CPUReservation` Metrik 50%.
`CPUUtilization`	Die Summe der Auslastung jedes einzelnen CPU-Kerns. Die CPU-Auslastung jedes Kernbereichs liegt zwischen 0 und 100. Wenn es beispielsweise vier gibt CPUs, liegt der `CPUUtilization` Bereich zwischen 0% und 400%. Bei der Verarbeitung von Aufträgen ist der Wert die CPU-Auslastung des Verarbeitungscontainers auf der Instance. Bei Trainingsaufträgen bildet dieser Wert die CPU-Auslastung des Algorithmus-Containers auf der Instance ab. Bei Stapeltransformationsaufträgen bildet dieser Wert die CPU-Auslastung des Umwandlungs-Containers auf der Instance ab. Bei Endpunktvarianten ist dieser Wert die Summe der CPU-Auslastung von primären und ergänzenden Containern auf der Instance. Anmerkung Für Multi-Instance-Jobs meldet jede Instance Kennzahlen zur CPU-Auslastung. In der Standardansicht in wird jedoch die durchschnittliche CPU-Auslastung aller Instanzen CloudWatch angezeigt. Einheiten: Prozent
`CPUUtilizationNormalized`	Die normalisierte Summe der Auslastung jedes einzelnen CPU-Kerns. Der Wert liegt zwischen 0 und 100%. Wenn es beispielsweise vier CPUs gibt und die `CPUUtilization` Metrik 200% ist, dann ist die `CPUUtilizationNormalized` Metrik 50%.
`DiskUtilization`	Der Prozentsatz des Speicherplatzes, die von den Containern auf einer Instance verwendet werden. Dieser Wertebereich liegt zwischen 0% und 100%. Diese Metrik wird für Stapeltransformationsaufträge nicht unterstützt. Bei Verarbeitungsaufträgen ist der Wert die Festplattenspeichernutzung des Verarbeitungscontainers auf der Instance. Bei Trainingsaufträgen bildet dieser Wert die Speicherplatzauslastung des Algorithmus-Containers auf der Instance ab. Bei Endpunktvarianten ist dieser Wert die Summe der Speicherplatzauslastung der primären und ergänzenden Container auf der Instance. Einheiten: Prozent Anmerkung Für Multi-Instance-Jobs meldet jede Instance Kennzahlen für die Festplattennutzung. In der Standardansicht in wird jedoch die durchschnittliche Festplattenauslastung aller Instanzen CloudWatch angezeigt.
`GPUMemoryUtilization`	Der Prozentsatz des GPU-Speichers, der von den Containern auf einer Instance belegt wird. Der Wertebereich liegt zwischen 0 und 100 und wird mit der Anzahl von multipliziert. GPUs Wenn es beispielsweise vier GPUs gibt, liegt der `GPUMemoryUtilization` Bereich zwischen 0% und 400%. Bei Verarbeitungsaufträgen ist der Wert die GPU-Speichernutzung des Verarbeitungscontainers auf der Instance. Bei Trainingsaufträgen bildet dieser Wert die GPU-Speichernutzung des Algorithmus-Containers auf der Instance ab. Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Speicherauslastung des Umwandlungs-Containers auf der Instance ab. Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Speichernutzung der primären und ergänzenden Container auf der Instance. Anmerkung Für Multi-Instance-Jobs meldet jede Instance Kennzahlen zur GPU-Speicherauslastung. In der Standardansicht in wird jedoch die durchschnittliche GPU-Speicherauslastung aller Instanzen CloudWatch angezeigt. Einheiten: Prozent
`GPUMemoryUtilizationNormalized`	Der normalisierte Prozentsatz des GPU-Speichers, der von den Containern auf einer Instance verwendet wird. Der Wert liegt zwischen 0% und 100%. Wenn es beispielsweise vier GPUs gibt und die `GPUMemoryUtilization` Metrik 200% ist, dann ist die `GPUMemoryUtilizationNormalized` Metrik 50%.
`GPUReservation`	Die Summe der von Containern auf einer Instance GPUs reservierten Werte. Der Wert liegt zwischen 0 und 100%. In den Einstellungen für eine Inferenzkomponente legen Sie die GPU-Reservierung auf fest. `NumberOfAcceleratorDevicesRequired` Wenn es beispielsweise 4 gibt GPUs und 2 reserviert sind, beträgt die `GPUReservation` Metrik 50%.
`GPUUtilization`	Der Prozentsatz der GPU-Einheiten, die von den Containern auf einer Instance verwendet werden. Der Wert kann zwischen 0 und 100 liegen und wird mit der Anzahl von multipliziert. GPUs Wenn es beispielsweise vier GPUs gibt, liegt der `GPUUtilization` Bereich zwischen 0% und 400%. Bei der Verarbeitung von Aufträgen ist der Wert die GPU-Auslastung des Verarbeitungscontainers auf der Instance. Bei Trainingsaufträgen bildet dieser Wert die GPU-Auslastung des Algorithmus-Containers auf der Instance ab. Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Auslastung des Umwandlungs-Containers auf der Instance ab. Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Auslastung von primären und ergänzenden Containern auf der Instance. Anmerkung Für Multi-Instance-Jobs meldet jede Instance Kennzahlen zur GPU-Auslastung. In der Standardansicht in wird jedoch die durchschnittliche GPU-Auslastung aller Instanzen CloudWatch angezeigt. Einheiten: Prozent
`GPUUtilizationNormalized`	Der normalisierte Prozentsatz der GPU-Einheiten, die von den Containern auf einer Instance verwendet werden. Der Wert liegt zwischen 0 und 100%. Wenn es beispielsweise vier GPUs gibt und die `GPUUtilization` Metrik 200% ist, dann ist die `GPUUtilizationNormalized` Metrik 50%.
`MemoryReservation`	Die Summe des Speichers, der von Containern auf einer Instance reserviert wurde. Der Wert liegt zwischen 0 und 100%. In den Einstellungen für eine Inferenzkomponente legen Sie die Speicherreservierung mit dem `MinMemoryRequiredInMb` Parameter fest. Wenn eine 32-GiB-Instance beispielsweise 1024 MB reserviert hat, beträgt die `MemoryReservation` Metrik 29,8%.
`MemoryUtilization`	Der Prozentsatz des Speichers, der von den Containern auf einer Instance belegt wird. Dieser Wertebereich liegt zwischen 0% und 100%. Bei der Verarbeitung von Aufträgen ist der Wert die Speichernutzung des Verarbeitungscontainers auf der Instance. Bei Trainingsaufträgen bildet dieser Wert die Speichernutzung des Algorithmus-Containers auf der Instance ab. Bei Stapeltransformationsaufträgen bildet dieser Wert die Speichernutzung des Umwandlungs-Containers auf der Instance ab. Bei Endpunktvarianten ist dieser Wert die Summe der Speichernutzung der primären und ergänzenden Container auf der Instance. Einheiten: Prozent Anmerkung Für Multi-Instance-Jobs meldet jede Instance Kennzahlen zur Speicherauslastung. In der Standardansicht in wird jedoch die durchschnittliche Speicherauslastung aller Instanzen CloudWatch angezeigt.

Dimensionen für die Instance-Kennzahlen für Verarbeitungsaufträge, Trainingsaufträge und Stapeltransformationsaufträge

Dimension Beschreibung

Dimension	Beschreibung
`Host`	Bei Verarbeitungsaufträgen wird der Wert für diese Dimension im Format `[processing-job-name]/algo-[instance-number-in-cluster]` angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für angegebenen Verarbeitungsauftrag und Instance filtern. Dieses Dimensionsformat ist nur im Namensraum `/aws/sagemaker/ProcessingJobs` vorhanden. Bei Trainingsaufträgen wird der Wert für diese Dimension im Format `[training-job-name]/algo-[instance-number-in-cluster]` angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für den angegebenen Trainingsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namensraum `/aws/sagemaker/TrainingJobs` vorhanden. Bei Stapeltransformationsaufträgen wird der Wert für diese Dimension im Format `[transform-job-name]/[instance-id]` angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für den angegebenen Stapeltransformationsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namensraum `/aws/sagemaker/TransformJobs` vorhanden.

Host

Bei Verarbeitungsaufträgen wird der Wert für diese Dimension im Format [processing-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für angegebenen Verarbeitungsauftrag und Instance filtern. Dieses Dimensionsformat ist nur im Namensraum /aws/sagemaker/ProcessingJobs vorhanden.

Bei Trainingsaufträgen wird der Wert für diese Dimension im Format [training-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für den angegebenen Trainingsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namensraum /aws/sagemaker/TrainingJobs vorhanden.

Bei Stapeltransformationsaufträgen wird der Wert für diese Dimension im Format [transform-job-name]/[instance-id] angegeben. Mit dieser Dimension können Sie Instance-Kennzahlen für den angegebenen Stapeltransformationsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namensraum /aws/sagemaker/TransformJobs vorhanden.

SageMaker Kennzahlen für Jobs von Inference Recommender

Der /aws/sagemaker/InferenceRecommendationsJobs-Namensraum enthält die folgenden Kennzahlen für Inference-Empfehlungs-Jobs.

Inference-Recommender-Kennzahlen

Metrik	Beschreibung
`ClientInvocations`	Die vom Inference Recommender beobachtete Anzahl der an einen Modell-Endpunkt gesendeten `InvokeEndpoint` Anfragen. Einheiten: keine Gültige Statistiken: Summe
`ClientInvocationErrors`	Die vom Inference Recommender beobachtete Anzahl der fehlgeschlagenen `InvokeEndpoint` Anfragen. Einheiten: keine Gültige Statistiken: Summe
`ClientLatency`	Das vom Inference Recommender beobachtete Zeitintervall zwischen dem Absenden eines `InvokeEndpoint` Aufrufs und dem Empfang einer Antwort. Beachten Sie, dass die Zeit in Millisekunden angegeben wird, während die Kennzahl für den `ModelLatency` Aufruf des Endpunkts in Mikrosekunden angegeben ist. Einheiten: Millisekunden Gültige Statistiken: Durchschnitt, Summe, Minimum, Maximum, Stichprobenzahl, Perzentile
`NumberOfUsers`	Die Anzahl der gleichzeitigen Benutzer, die `InvokeEndpoint` Anfragen an den Modell-Endpunkt senden. Einheiten: keine Gültige Statistiken: Maximum, Minimum, Durchschnitt

Dimensionen für Inference-Recommender-Job-Kennzahlen

Dimension	Beschreibung
`JobName`	Filtert die Kennzahlen für den Inference-Recommender-Job für den angegebenen Inference-Recommender-Job.
`EndpointName`	Filtert die Kennzahlen für Inference-Recommender-Jobs für den angegebenen Endpunkt.

SageMaker Ground Truth Truth-Metriken

Ground-Truth-Kennzahlen

Metrik	Beschreibung
`ActiveWorkers`	Nur ein einziger aktiver Mitarbeiter in einem privaten Arbeitsteam hat eine Aufgabe eingereicht, freigegeben oder abgelehnt. Verwenden Sie die Summenstatistik, um die Gesamtzahl der aktiven Arbeiter zu erhalten. Ground Truth versucht, jedes einzelne `ActiveWorkers` Event einmal durchzuführen. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Kennzahl möglicherweise nicht die Gesamtzahl der aktiven Mitarbeiter an. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`DatasetObjectsAutoAnnotated`	Die Anzahl der Datensatz-Objekte, die in einem Etikettierungsauftrag automatisch mit Anmerkungen versehen werden. Diese Metrik wird nur ausgegeben, wenn die automatisierte Etikettierung aktiviert ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik. Einheiten: keine Gültige Statistiken: Max
`DatasetObjectsHumanAnnotated`	Die Anzahl der Datensatz-Objekte, die in einem Etikettierungsauftrag durch eine Person mit Anmerkungen versehen werden. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik. Einheiten: keine Gültige Statistiken: Max
`DatasetObjectsLabelingFailed`	Die Anzahl der Datensatz-Objekte, deren Etikettierung in einem Etikettierungsauftrag fehlgeschlagen ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik. Einheiten: keine Gültige Statistiken: Max
`JobsFailed`	Nur ein einziger Etikettierungsauftrag ist fehlgeschlagen. Um die Gesamtzahl der fehlgeschlagenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`JobsSucceeded`	Nur ein einziger Etikettierungsauftrag war erfolgreich. Um die Gesamtzahl der erfolgreich durchgeführten Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`JobsStopped`	Nut ein einziger Etikettierungsauftrag wurde gestoppt. Um die Gesamtzahl der angehaltenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`TasksAccepted`	Von einem Mitarbeiter wurde eine einzige Aufgabe akzeptiert. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Mitarbeitern akzeptierten Aufgaben zu erhalten. Ground Truth versucht, jedes einzelne `TaskAccepted` Ereignis einmal durchzuführen. Wenn diese Lieferung erfolglos ist, gibt diese Kennzahl ggf. nicht die Gesamtzahl der akzeptierten Aufgaben an. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`TasksDeclined`	Von einem Mitarbeiter wurde eine einzige Aufgabe abgelehnt. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Mitarbeitern abgelehnten Aufgaben zu erhalten. Ground Truth versucht, jedes einzelne `TasksDeclined` Ereignis einmal durchzuführen. Wenn diese Lieferung erfolglos ist, gibt diese Kennzahl ggf. nicht die Gesamtzahl der abgelehnten Aufgaben an. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`TasksReturned`	Eine einzige Aufgabe wurde zurückgegeben. Verwenden Sie die Summenstatistik, um die Gesamtzahl der zurückgegebenen Aufgaben zu erhalten. Ground Truth versucht, jedes einzelne `TasksReturned` Ereignis einmal durchzuführen. Wenn diese Lieferung erfolglos ist, gibt diese Kennzahl ggf. nicht die Gesamtzahl der zurückgegebenen Aufgaben an. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`TasksSubmitted`	Eine einzige Aufgabe wurde von einem privaten Mitarbeiter eingereicht/abgeschlossen. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Mitarbeitern zurückgegebenen Aufgaben zu erhalten. Ground Truth versucht, jedes einzelne `TasksSubmitted` Ereignis einmal durchzuführen. Wenn diese Lieferung erfolglos ist, gibt diese Kennzahl ggf. nicht die Gesamtzahl der eingereichten Aufgaben an. Einheiten: keine Gültige Statistiken: Summe, Stichprobenanzahl
`TimeSpent`	Die für eine Aufgabe aufgewendete Zeit, die von einem privaten Arbeiter abgeschlossen wurde. Diese Kennzahl beinhaltet nicht die Zeit, in der ein Mitarbeiter eine Pause einlegte. Ground Truth versucht, jedes `TimeSpent` Ereignis einmal abzuliefern. Wenn diese Lieferung erfolglos ist, gibt diese Kennzahl ggf. nicht die aufgewendete Gesamtzeit an. Einheiten: Sekunden Gültige Statistiken: Summe, Stichprobenanzahl
`TotalDatasetObjectsLabeled`	Die Anzahl der Datensatz-Objekte, deren Etikettierung in einem Etikettierungsauftrag erfolgreich war. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik. Einheiten: keine Gültige Statistiken: Max

Dimensionen für Datensatz-Objekt-Kennzahlen

Dimension	Beschreibung
`LabelingJobName`	Filtert die Kennzahlen für die Datensatz-Objektanzahl eines Etikettierungsauftrags.

Amazon SageMaker Feature Store-Metriken

Feature-Store-Verbrauchskennzahlen

Metrik	Beschreibung
`ConsumedReadRequestsUnits`	Die Anzahl über den angegebenen Zeitraum verbrauchten Leseeinheiten. Sie können die verbrauchten Leseeinheiten für einen Laufzeitvorgang des Feature-Stores und die dazugehörige Feature-Gruppe abrufen. Einheiten: keine Gültige Statistiken: Alle
`ConsumedWriteRequestsUnits`	Die Anzahl der über den angegebenen Zeitraum verbrauchten Schreibeinheiten. Sie können die verbrauchten Schreibeinheiten für einen Laufzeitvorgang des Feature-Stores und die dazugehörige Feature-Gruppe abrufen. Einheiten: keine Gültige Statistiken: Alle
`ConsumedReadCapacityUnits`	Die Anzahl der bereitgestellten Lesekapazitätseinheiten, die im angegebenen Zeitraum verbraucht wurden. Sie können die verbrauchten Lesekapazitätseinheiten für einen Feature-Store-Laufzeitvorgang und die entsprechende Feature-Gruppe abrufen. Einheiten: keine Gültige Statistiken: Alle
`ConsumedWriteCapacityUnits`	Die Anzahl der bereitgestellten Schreibkapazitätseinheiten, die im angegebenen Zeitraum verbraucht wurden. Sie können die verbrauchten Schreibkapazitätseinheiten für einen Feature-Store-Laufzeitvorgang und die entsprechende Feature-Gruppe abrufen. Einheiten: keine Gültige Statistiken: Alle

Dimensionen für Verbrauchskennzahlen für den Feature-Store

Dimension	Beschreibung
`FeatureGroupName`, `OperationName`	Filtert Laufzeitverbrauchskennzahlen zum Feature-Store der Feature-Gruppe und des von Ihnen angegebenen Vorgangs.

Betriebskennzahlen zum Feature-Store

Metrik	Beschreibung
`Invocations`	Die Anzahl der im angegebenen Zeitraum an den Feature-Store-Laufzeitbetrieb gestellten Anfragen. Einheiten: keine Gültige Statistiken: Summe
`Operation4XXErrors`	Die Anzahl der an den Feature-Store-Laufzeitbetrieb gestellten Anfragen, bei denen der Vorgang einen Antwortcode 4xx HTTP zurückgegeben hat. Für jede 4xx-Antwort wird 1 gesendet, andernfalls wird 0 gesendet. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`Operation5XXErrors`	Die Anzahl der an den Feature-Store-Laufzeitbetrieb gestellten Anfragen, bei denen der Vorgang einen Antwortcode 5xx HTTP zurückgegeben hat. Für jede 5xx-Antwort wird 1 gesendet; andernfalls wird 0 gesendet. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`ThrottledRequests`	Die Anzahl der an den Feature-Store-Laufzeitbetrieb gestellten Anfragen, bei denen die Anfrage gedrosselt wurde. Für jede gedrosselte Anfrage wird 1 gesendet; andernfalls wird 0 gesendet. Einheiten: keine Gültige Statistiken: Durchschnitt, Summe
`Latency`	Der Zeitraum für die Verarbeitung von Anfragen an den Feature-Store-Laufzeitbetrieb. Dieses Intervall wird vom Empfang der Anfrage durch SageMaker AI bis zur Rückgabe einer Antwort an den Client gemessen. Einheiten: Mikrosekunden Gültige Statistiken: Durchschnitt, Summe, Minimum, Maximum, Stichprobenzahl, Perzentile

Dimensionen für Betriebskennzahlen des Feature Store

Dimension	Beschreibung
`FeatureGroupName`, `OperationName`	Filtert die Betriebskennzahlen der Feature-Store-Laufzeit der Feature-Gruppe und des von Ihnen angegebenen Vorgangs. Sie können diese Dimensionen für Operationen verwenden, bei denen es sich nicht um Batch-Operationen handelt GetRecord, z. B. für PutRecord, und DeleteRecord.
`OperationName`	Filtert die Betriebskennzahlen der Feature-Store-Laufzeit für den von Ihnen angegebenen Vorgang. Sie können diese Dimension für Batch-Operationen wie verwenden BatchGetRecord.

SageMaker Metriken für Pipelines

Der Namensraum AWS/Sagemaker/ModelBuildingPipeline enthält die folgenden Kennzahlen für die Ausführung von Pipelines.

Zwei Kategorien von Kennzahlen zur Ausführung von Pipeline stehen zur Verfügung:

Ausführungskennzahlen für alle Pipelines – Kennzahlen zur Pipeline-Ausführung auf Kontoebene (für alle Pipelines im aktuellen Konto)
Ausführungskennzahlen nach Pipeline – Kennzahlen zur Pipeline-Ausführung je Pipeline

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Kennzahlen zur Ausführung von Pipelines

Metrik	Beschreibung
`ExecutionStarted`	Die Anzahl der Pipeline-Ausführungen, die begonnen haben. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`ExecutionFailed`	Die Anzahl der Pipeline-Ausführungen, die fehlgeschlagen sind. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`ExecutionSucceeded`	Die Anzahl der Pipeline-Ausführungen, die erfolgreich waren. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`ExecutionStopped`	Die Anzahl der Pipeline-Ausführungen, die abgebrochen wurden. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`ExecutionDuration`	Die Dauer in Millisekunden, für die die Pipeline-Ausführung lief. Einheiten: Millisekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl

Dimensionen für Ausführungskennzahlen nach Pipeline

Dimension	Beschreibung
`PipelineName`	Filtert Kennzahlen zur Pipeline-Ausführung für eine angegebene Pipeline.

Kennzahlen für Pipeline-Schritte

Der Namensraum AWS/Sagemaker/ModelBuildingPipeline enthält die folgenden Kennzahlen für Pipeline-Schritte.

Die Kennzahlen sind mit einminütiger Frequenz verfügbar.

Metrik	Beschreibung
`StepStarted`	Die Anzahl der Schritte, die begonnen haben. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`StepFailed`	Die Anzahl der Schritte, die fehlgeschlagen sind. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`StepSucceeded`	Die Anzahl der Schritte, die erfolgreich waren. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`StepStopped`	Die Anzahl der Schritte, die abgebrochen wurden. Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Summe
`StepDuration`	Die Dauer in Millisekunden, für die der Schritt lief. Einheiten: Millisekunden Gültige Statistiken: Durchschnitt, Minimum, Maximum, Stichprobenanzahl

Dimensionen für Schrittkennzahlen für Pipelines

Dimension	Beschreibung
`PipelineName`, `StepName`	Filtert Schrittkennzahlen für eine angegebene Pipeline und den jeweiligen Schritt.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Tools zur Überwachung der AWS Ressourcen, die während der Nutzung von Amazon SageMaker AI bereitgestellt werden

Protokollierung mit CloudWatch

Nächstes Thema:

Protokollierung mit CloudWatch

Vorheriges Thema:

Tools zur Überwachung der AWS Ressourcen, die während der Nutzung von Amazon SageMaker AI...

Brauchen Sie Hilfe?

Auf dieser Seite

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden

Metriken für die Überwachung von Amazon SageMaker AI mit Amazon CloudWatch

SageMaker KI-Metriken und -Dimensionen

SageMaker Metriken zum Aufrufen von KI-Endpunkten

SageMaker Metriken für KI-Inferenzkomponenten

SageMaker KI-Endpunktmetriken für mehrere Modelle

SageMaker KI-Jobs und Endpunktmetriken

Anmerkung

Tipp

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

SageMaker Kennzahlen für Jobs von Inference Recommender

SageMaker Ground Truth Truth-Metriken

Amazon SageMaker Feature Store-Metriken

SageMaker Metriken für Pipelines

Nächstes Thema:

Vorheriges Thema:

Brauchen Sie Hilfe?

Auf dieser Seite

Related resources

Hat Ihnen diese Seite geholfen?

Related resources

Eine Abbildung, die zeigt, dass die Gesamtlatenz die Summe aus Netzwerk-, Overhead- und Modell-Latenzen ist.