Überwachen von Amazon SageMaker mit Amazon CloudWatch - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen von Amazon SageMaker mit Amazon CloudWatch

Sie können Amazon SageMaker mithilfe von Amazon CloudWatch überwachen, das Rohdaten sammelt und zu lesbaren Metriken verarbeitet, die nahezu in Echtzeit bereitgestellt werden. Diese Statistiken werden 15 Monate gespeichert, damit Sie auf Verlaufsinformationen zugreifen können und einen besseren Überblick darüber erhalten, wie Ihre Webanwendung oder der Service ausgeführt werden. Die Amazon CloudWatch CloudWatch-Konsole beschränkt die Suche allerdings auf Metriken, die in den letzten 2 Wochen aktualisiert wurden. Diese Einschränkung stellt sicher, dass die aktuellen Aufträge in Ihrem Namespace aufgeführt werden. Um Metriken ohne Verwendung einer Suche grafisch darzustellen, geben Sie den exakten Namen in der Quellansicht ein. Sie können auch Alarme einrichten, die auf bestimmte Grenzwerte achten und Benachrichtigungen senden oder Aktivitäten auslösen, wenn diese Grenzwerte erreicht werden. Weitere Informationen finden Sie im Amazon-CloudWatch-Benutzerhandbuch.

SageMaker-Endpunktaufrufe -Metriken

DieAWS/SageMaker-Namespace enthält die folgenden Anforderungsmetriken von -AufrufenInvokeEndPointaus.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Weitere Informationen darüber, wie lange CloudWatch-Metriken aufbewahrt werden, finden Sie unterGetMetricStatisticsimAmazon CloudWatch CloudWatch-API-Referenzaus.

Endpoint Invocation Metrics (Metriken für Endpunktaufrufe)

Metrik Beschreibung
Invocation4XXErrors

Die Anzahl der InvokeEndpoint-Anforderungen, bei denen das Modell den HTTP-Antwortcode 4xx zurückgegeben hat. Für jede 4xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Invocation5XXErrors

Die Anzahl der InvokeEndpoint-Anforderungen, bei denen das Modell den HTTP-Antwortcode 5xx zurückgegeben hat. Für jede 5xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Invocations

Die Anzahl vonInvokeEndpoint-Anforderungen, die an einen Modellendpunkt gesendet werden.

Mit der Summenstatistik (Sum) können Sie die Gesamtanzahl der an einen Modellendpunkt gesendeten Anforderungen abrufen.

Einheiten: Keine

Gültige Statistiken: Summe

InvocationsPerInstance

Die Anzahl der an ein Modell gesendeten Aufrufe, normalisiert durchInstanceCountin jeder ProductionVariant. 1/numberOfInstanceswird als Wert für jede Anfrage gesendet, wonumberOfInstancesist die Anzahl der aktiven Instances für die ProductionVariant hinter dem Endpunkt zum Zeitpunkt der Anforderung.

Einheiten: Keine

Gültige Statistiken: Summe

ModelLatency

Das Zeitintervall bis zur Reaktion eines Modells, wie von SageMaker angezeigt. Dieses Intervall enthält die lokale Kommunikationszeitspanne für das Senden der Anforderung und Abrufen der Antwort vom Container eines Modells sowie die Zeitspanne für das Abschließen der Inferenz im Container.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

OverheadLatency

Das Zeitintervall, das zur Reaktion auf eine Client-Anforderung von SageMaker-Gemeinkosten hinzugefügt wurde. Dieses Intervall wird ab dem Zeitpunkt gemessen, als SageMaker die Anforderung empfängt, bis zur Rückgabe einer Antwort an den Client abzüglich derModelLatencyaus. Die Overhead-Latenz variiert und ist von mehreren Faktoren abhängig, einschließlich Anforderungs- und Antwortnutzlastgrößen, Anforderungshäufigkeit und Authentifizierung/Autorisierung der Anforderung.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

ModelSetupTime

Die Zeit, die benötigt wird, um neue Rechenressourcen für einen serverlosen Endpunkt zu starten. Die Zeit kann je nach Modellgröße, wie lange es dauert, das Modell herunterzuladen und der Startzeit des Containers variieren.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Min, Max, SampleCount

Dimensions for Endpoint Invocation Metrics (Dimensionen der Metriken für Endpunktaufrufe)

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

SageMaker-Endpunktmetriken für mehrere Modelle

DieAWS/SageMakerDer -Namespace enthält das folgende Modell, das Metriken aus Aufrufen an lädt.InvokeEndPointaus.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Weitere Informationen darüber, wie lange CloudWatch-Metriken aufbewahrt werden, finden Sie unterGetMetricStatisticsimAmazon CloudWatch CloudWatch-API-Referenzaus.

Metriken zum Laden von Multimodell-Endpunktmodellen

Metrik Beschreibung
ModelLoadingWaitTime

Das Zeitintervall, über das hinweg eine Aufrufanforderung darauf gewartet hat, dass das Zielmodell heruntergeladen oder geladen wird, oder beides, um Interferenzen vorzunehmen.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

ModelUnloadingTime

Das Zeitintervall, das zum Entladen des Modells über den UnloadModel-API-Aufruf des Containers erforderlich war.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

ModelDownloadingTime

Das Zeitintervall, das zum Herunterladen des Modells von Amazon Simple Storage Service (Amazon S3) erforderlich war.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

ModelLoadingTime

Das Zeitintervall, das zum Laden des Modells über den LoadModel-API-Aufruf des Containers erforderlich war.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

ModelCacheHit

Die Anzahl der InvokeEndpoint-Anforderungen, die an den Multimodell-Endpunkt gesendet werden, für die das Modell bereits geladen wurde.

Die Durchschnittsstatistik zeigt das Verhältnis der Anforderungen an, für die das Modell bereits geladen wurde.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe, Sum, Sum

Dimensionen für Metriken zum Laden von Multimodell-Endpunktmodellen

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

Die/aws/sagemaker/Endpoints-Namespaces enthalten die folgenden Instance-Metriken von -AufrufenInvokeEndPointaus.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Weitere Informationen darüber, wie lange CloudWatch-Metriken aufbewahrt werden, finden Sie unterGetMetricStatisticsimAmazon CloudWatch CloudWatch-API-Referenzaus.

Metriken für Multimodell-Endpunktmodell-Instances

Metrik Beschreibung
LoadedModelCount

Die Anzahl der Modelle, die in die Container des Multimodell-Endpunkts geladen werden. Diese Metrik wird pro Instance ausgegeben.

Die Durchschnittsstatistik mit einem Zeitraum von 1 Minute gibt Ihnen die durchschnittliche Anzahl der pro Instance geladenen Modelle an.

Die Summenstatistik gibt Ihnen die Gesamtzahl der Modelle an, die über alle Instances im Endpunkt geladen wurden.

Die Modelle, die von dieser Metrik verfolgt werden, sind nicht unbedingt eindeutig, da ein Modell möglicherweise in mehrere Container am Endpunkt geladen wird.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

Dimensionen für Metriken zum Laden von Multimodell-Endpunktmodellen

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

SageMaker Jobs und Endpunkt-Metriken

Die/aws/sagemaker/ProcessingJobs,/aws/sagemaker/TrainingJobs,/aws/sagemaker/TransformJobs, und/aws/sagemaker/EndpointsNamespaces umfassen die folgenden Metriken für die Trainingsaufträge und Endpunkt-Instances.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Anmerkung

Amazon CloudWatch unterstützthochauflösende benutzerdefinierte Metrikenund seine beste Auflösung beträgt 1 Sekunde. Je feiner die Auflösung jedoch, desto kürzer ist die Lebensdauer der CloudWatch-Metriken. Für die Frequenzauflösung von 1 Sekunde sind die CloudWatch-Metriken 3 Stunden lang verfügbar. Weitere Informationen zur Auflösung und Lebensdauer der CloudWatch-Metriken finden Sie unterGetMetricStatisticsimReferenz zu Amazon CloudWatch APIaus.

Tipp

Wenn Sie Ihren Schulungsjob mit einer feineren Auflösung von bis zu 100 Millisekunden (0,1 Sekunden) Granularität profilieren und die Schulungsmetriken in Amazon S3 für benutzerdefinierte Analysen jederzeit auf unbestimmte Zeit speichern möchten, sollten Sie die Verwendung vonAmazon SageMaker SageMaker-Debuggeraus. SageMaker Debugger bietet integrierte Regeln zur automatischen Erkennung häufiger Trainingsprobleme. Er erkennt Probleme mit der Auslastung der Hardwareressourcen (wie CPU-, GPU- und I/O-Engpässe) und nicht konvergierende Modellprobleme (wie Überfit, verschwindende Gradienten und explodierende Tensoren). SageMaker Debugger bietet auch Visualisierungen über Studio und seinen Profilerstellungsbericht. Informationen zur Untersuchung der Debugger-Visualisierungen finden Sie unterSageMaker Debugger Insights Dashboard Exemplarische Vorgehensweise,Exemplarische Vorgehensweise zur Debugger-Profilerstellung, undAnalysieren Sie Daten mit der SmDeBug Client Libraryaus.

Processing Job, Training Job, Batch Transform Job, and Endpoint Instance Metrics (Verarbeitungsauftrag, Trainingsauftrag, Stapeltransformationsauftrag und Endpunkt-Instance-Metriken)

Metrik Beschreibung
CPUUtilization Die Summe der Auslastung jedes einzelnen CPU-Kerns. Die CPU-Auslastung jedes Kernbereichs liegt zwischen 0 und 100. Wenn beispielsweise vier CPUs genutzt werden, wird derCPUUtilizationDer Bereich liegt bei 0% - 400%. Bei der Verarbeitung von Aufträgen ist der Wert die CPU-Auslastung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die CPU-Auslastung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die CPU-Auslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der CPU-Auslastung von primären und ergänzenden Containern auf der Instance.

Anmerkung

Für Multi-Instance meldet jede Instance CPU-Auslastungsmetriken. Die Standardansicht in CloudWatch zeigt allerdings die durchschnittliche CPU-Auslastung für alle Instances.

Einheiten: Prozent

MemoryUtilization

Der Prozentsatz des Speichers, der von den Containern auf einer Instance belegt wird. Dieser Wertebereich beträgt 0% - 100%.

Bei der Verarbeitung von Aufträgen ist der Wert die Speichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die Speichernutzung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die Speichernutzung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der Speichernutzung der primären und ergänzenden Container auf der Instance.

Einheiten: Prozent

Anmerkung

Für Multi-Instance meldet jede Instance Speicherauslastungsmetriken. Die Standardansicht in CloudWatch zeigt allerdings die durchschnittliche Speicherauslastung für alle Instances.

GPUUtilization

Der Prozentsatz der GPU-Einheiten, die von den Containern auf einer Instance verwendet werden. Der Wert kann zwischen -100 liegen und wird mit der GPU-Anzahl multipliziert. Wenn beispielsweise vier GPUs genutzt werden, ist derGPUUtilizationDer Bereich liegt bei 0% - 400%.

Bei der Verarbeitung von Aufträgen ist der Wert die GPU-Auslastung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die GPU-Auslastung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Auslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Auslastung von primären und ergänzenden Containern auf der Instance.

Anmerkung

Für Multi-Instance meldet jede Instance GPU-Auslastungsmetriken. Die Standardansicht in CloudWatch zeigt allerdings die durchschnittliche GPU-Auslastung für alle Instances.

Einheiten: Prozent

GPUMemoryUtilization

Der Prozentsatz des GPU-Speichers, der von den Containern auf einer Instance belegt wird. Der Wertebereich beträgt 0-100 und wird mit der GPU-Anzahl multipliziert. Wenn beispielsweise vier GPUs genutzt werden, ist derGPUMemoryUtilizationDer Bereich liegt bei 0% - 400%.

Bei Verarbeitungsaufträgen ist der Wert die GPU-Speichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die GPU-Speichernutzung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Speicherauslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Speichernutzung der primären und ergänzenden Container auf der Instance.

Anmerkung

Für Multi-Instance meldet jede Instance GPU-Speicherauslastungsmetriken. Die Standardansicht in CloudWatch zeigt allerdings die durchschnittliche GPU-Speicherauslastung für alle Instances.

Einheiten: Prozent

DiskUtilization

Der Prozentsatz des Speicherplatzes, die von den Containern auf einer Instance verwendet werden. Dieser Wertebereich beträgt 0% - 100%. Diese Metrik wird für Stapeltransformationsaufträge nicht unterstützt.

Bei Verarbeitungsaufträgen ist der Wert die Festplattenspeichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die Speicherplatzauslastung des Algorithmus-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der Speicherplatzauslastung der primären und ergänzenden Container auf der Instance.

Einheiten: Prozent

Anmerkung

Für Multi-Instance meldet jede Instance Festplattennutzungsmetriken. Die Standardansicht in CloudWatch zeigt allerdings die durchschnittliche Festplattennutzung für alle Instances.

Dimensions for Processing Job, Training Job and Batch Transform Job Instance Metrics (Dimensionen für Verarbeitungsauftrags-, Trainingsauftrags- und Stapeltransformationsauftrags-Instance-Metriken)

Dimension Beschreibung
Host

Bei Verarbeitungsaufträgen wird der Wert für diese Dimension im Format [processing-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Metriken für angegebenen Verarbeitungsauftrag und Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/ProcessingJobs vorhanden.

Bei Schulungsaufträgen wird der Wert für diese Dimension im Format [training-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Metriken für den angegebenen Schulungsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/TrainingJobs vorhanden.

Bei Stapeltransformationsaufträgen wird der Wert für diese Dimension im Format [transform-job-name]/[instance-id] angegeben. Mit dieser Dimension können Sie Instance-Metriken für den angegebenen Stapeltransformationsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/TransformJobs vorhanden.

SageMaker-Ground Truth Metrics

Ground Truth Metriken

Metrik Beschreibung
ActiveWorkers

Ein einzelner aktiver Mitarbeiter in einem privaten Arbeitsteam hat eine Aufgabe eingereicht, freigegeben oder abgelehnt. Um die Gesamtzahl aktiver Mitarbeiter zu erhalten, verwenden Sie die Summenstatistik. Ground Truth versucht, jeden Einzelnen zu liefernActiveWorkers-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, meldet diese Kennzahl möglicherweise nicht die Gesamtzahl der aktiven Arbeitnehmer

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

DatasetObjectsAutoAnnotated

Die Anzahl der Dataset-Objekte, die in einem Etikettierungsauftrag automatisch mit Anmerkungen versehen werden. Diese Metrik wird nur ausgegeben, wenn die automatisierte Etikettierung aktiviert ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

DatasetObjectsHumanAnnotated

Die Anzahl der Dataset-Objekte, die in einem Etikettierungsauftrag durch eine Person mit Anmerkungen versehen werden. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

DatasetObjectsLabelingFailed

Die Anzahl der Dataset-Objekte, deren Etikettierung in einem Etikettierungsauftrag fehlgeschlagen ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

JobsFailed

Ein einziger Etikettierauftrag ist fehlgeschlagen. Um die Gesamtzahl der fehlgeschlagenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

JobsSucceeded

Ein einziger Etikettierauftrag war erfolgreich. Um die Gesamtzahl der erfolgreich durchgeführten Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

JobsStopped

Ein einziger Etikettierauftrag wurde gestoppt. Um die Gesamtzahl der angehaltenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

TasksAccepted

Eine einzige Aufgabe wurde von einem Arbeitnehmer akzeptiert. Um die Gesamtzahl der von den Arbeitern akzeptierten Aufgaben zu erhalten, verwenden Sie die Summenstatistik. Ground Truth versucht, jeden Einzelnen zu liefernTaskAccepted-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der angenommenen Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

TasksDeclined

Eine einzige Aufgabe wurde von einem Arbeitnehmer abgelehnt. Um die Gesamtzahl der von den Arbeitern abgelehnten Aufgaben zu erhalten, verwenden Sie die Summenstatistik. Ground Truth versucht, jeden Einzelnen zu liefernTasksDeclined-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der abgelehnten Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

TasksReturned

Eine einzelne Aufgabe wurde zurückgegeben. Um die Gesamtzahl der zurückgegebenen Aufgaben zu erhalten, verwenden Sie die Summenstatistik. Ground Truth versucht, jeden Einzelnen zu liefernTasksReturned-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der zurückgegebenen Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

TasksSubmitted

Eine einzelne Aufgabe wurde von einem privaten Arbeitnehmer eingereichtet/abgeschlossen. Um die Gesamtzahl der von Arbeitern übermittelten Aufgaben zu erhalten, verwenden Sie die Summenstatistik. Ground Truth versucht, jeden Einzelnen zu liefernTasksSubmitted-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der übermittelten Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Sum, Stichprobe

TimeSpent

Zeit, die für eine Aufgabe aufgewendet wurde, die von einem privaten Arbeitnehmer abgeschlossen wurde. Diese Metrik beinhaltet keine Zeit, in der ein Arbeiter pausiert oder eine Pause eingelegt hat. Ground Truth versucht, jeden zu liefernTimeSpent-Ereignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht den Gesamtaufwand an.

Einheiten: Sekunden

Gültige Statistiken: Sum, Stichprobe

TotalDatasetObjectsLabeled

Die Anzahl der Dataset-Objekte, deren Etikettierung in einem Etikettierungsauftrag erfolgreich war. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

Dimensionen für Dataset-Objektmetriken

Dimension Beschreibung
LabelingJobName

Filtert die Metriken für die Dataset-Objektanzahl eines Etikettierungsauftrags.

SageMaker Feature Store Metriken

Feature Store-Metriken

Metrik Beschreibung
ConsumedReadRequestsUnits

Die Anzahl der verbrauchten Lese-Einheiten für den angegebenen Zeitraum. Sie können die verbrauchten Leseeinheiten für einen Feature-Store-Laufzeitvorgang und die entsprechende Feature-Gruppe abrufen.

Einheiten: Keine

Gültige Statistiken: Alle

ConsumedWriteRequestsUnits

Die Anzahl der verbrauchten Schreibeinheiten für den angegebenen Zeitraum. Sie können die verbrauchten Schreibeinheiten für einen Feature-Store-Laufzeitvorgang und die entsprechende Feature-Gruppe abrufen.

Einheiten: Keine

Gültige Statistiken: Alle

Abmessungen für Feature Store-Metriken

Dimension Beschreibung
FeatureGroupName, OperationName

Filtert Feature-Store-Laufzeit-Betriebsmetriken der angegebenen Feature-Gruppe.

SageMaker-Pipeline-Metriken

DieAWS/Sagemaker/ModelBuildingPipelineDer -Namespace enthält die folgenden Metriken für Pipeline-Ausführungen.

Es sind zwei Kategorien von Pipelines-Ausführungsmetriken verfügbar:

  • Ausführungsmetriken über alle Pipelines— Metriken zur Pipeline-Ausführung auf Kontoebene (für alle Pipelines im Girokonto)

  • Ausführungsmetriken nach Pipeline— Metriken für die Pipeline-Ausführung pro Pipeline

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Pipeline-Ausführungsmetriken

Metrik Beschreibung
ExecutionStarted

Die Anzahl der gestarteten Pipeline-Ausführungen.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionFailed

Die Anzahl der fehlgeschlagenen Pipeline-Ausführungen.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionSucceeded

Die Anzahl der erfolgreichen Pipeline-Ausführungen.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionStopped

Die Anzahl der Pipeline-Ausführungen, die gestoppt wurden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionDuration

Die Dauer in Millisekunden, die die Pipeline-Ausführung ausgeführt hat.

Einheiten: Millisekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

Dimensionen für Ausführungsmetriken nach Pipeline

Dimension Beschreibung
PipelineName

Filtert Metriken für die Pipeline-Ausführung für eine bestimmte Pipeline.

Pipelines Step Metriken

DieAWS/Sagemaker/ModelBuildingPipelineDer -Namespace enthält die folgenden Metriken für Pipeline-Schritte.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Metrik Beschreibung
StepStarted

Die Anzahl der gestarteten Schritte.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepFailed

Die Anzahl der fehlgeschlagenen Schritte.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepSucceeded

Die Anzahl der erfolgreichen Schritte.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepStopped

Die Anzahl der gestoppten Schritte.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepDuration

Die Dauer der Ausführung des Schritts in Millisekunden.

Einheiten: Millisekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, SampleCount

Dimensionen für Pipelines Step Metriken

Dimension Beschreibung
PipelineName, StepName

Filtert Schrittmetriken für eine bestimmte Pipeline und einen bestimmten Schritt.