Überwachen von Amazon SageMaker mit Amazon CloudWatch - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen von Amazon SageMaker mit Amazon CloudWatch

Sie können Amazon überwachen SageMaker Nutzung von Amazon CloudWatch, das Rohdaten sammelt und zu lesbaren Metriken verarbeitet, die nahezu in Echtzeit erfolgen. Diese Statistiken werden 15 Monate gespeichert, damit Sie auf Verlaufsinformationen zugreifen können und einen besseren Überblick darüber erhalten, wie Ihre Webanwendung oder der Service ausgeführt werden. Allerdings ist der Amazonas CloudWatch console beschränkt die Suche auf Metriken, die in den letzten 2 Wochen aktualisiert wurden. Diese Einschränkung stellt sicher, dass die aktuellen Aufträge in Ihrem Namespace aufgeführt werden. Um Metriken ohne Verwendung einer Suche grafisch darzustellen, geben Sie den exakten Namen in der Quellansicht ein. Sie können auch Alarme einrichten, die auf bestimmte Grenzwerte achten und Benachrichtigungen senden oder Aktivitäten auslösen, wenn diese Grenzwerte erreicht werden. Weitere Informationen finden Sie hier:Amazon CloudWatch Benutzerhandbuch.

SageMaker Aufrufmetriken für Endpunkte

Der AWS/SageMaker-Namespace enthält die folgenden Anforderungsmetriken von InvokeEndpoint-Aufrufen.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Für Informationen darüber, wie lange CloudWatch Metriken werden beibehalten für, sieheGetMetricStatisticsin derAmazon CloudWatch API-Referenz.

Endpoint Invocation Metrics (Metriken für Endpunktaufrufe)

Metrik Beschreibung
Invocation4XXErrors

Die Anzahl der InvokeEndpoint-Anforderungen, bei denen das Modell den HTTP-Antwortcode 4xx zurückgegeben hat. Für jede 4xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Invocation5XXErrors

Die Anzahl der InvokeEndpoint-Anforderungen, bei denen das Modell den HTTP-Antwortcode 5xx zurückgegeben hat. Für jede 5xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Invocations

Die Anzahl derInvokeEndpointAnfragen, die an einen Modellendpunkt gesendet werden

Mit der Summenstatistik (Sum) können Sie die Gesamtanzahl der an einen Modellendpunkt gesendeten Anforderungen abrufen.

Einheiten: Keine

Gültige Statistiken: Summe

InvocationsPerInstance

Die Anzahl der Aufrufe, die an ein Modell gesendet wurden, normalisiert durchInstanceCountin jedem ProductionVariant. 1/numberOfInstanceswird als Wert für jede Anfrage gesendet, wobeinumberOfInstancesist die Anzahl der aktiven Instances für ProductionVariant hinter dem Endpunkt zum Zeitpunkt der Anfrage.

Einheiten: Keine

Gültige Statistiken: Summe

ModelLatency

Das Zeitintervall, das ein Modell benötigt, um aus der Sicht zu reagieren SageMaker. Dieses Intervall enthält die lokale Kommunikationszeitspanne für das Senden der Anforderung und Abrufen der Antwort vom Container eines Modells sowie die Zeitspanne für das Abschließen der Inferenz im Container.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

OverheadLatency

Das Zeitintervall plus die benötigte Zeit für die Reaktion auf eine Client-Anforderung mal SageMaker -Overhead. Dieses Intervall wird ab der Zeit gemessen SageMaker empfängt die Anfrage, bis sie eine Antwort an den Client zurückgibt, abzüglich derModelLatency. Die Overhead-Latenz variiert und ist von mehreren Faktoren abhängig, einschließlich Anforderungs- und Antwortnutzlastgrößen, Anforderungshäufigkeit und Authentifizierung/Autorisierung der Anforderung.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

ModelSetupTime

Die Zeit, die benötigt wird, um neue Rechenressourcen für einen serverlosen Endpunkt zu starten. Die Zeit kann abhängig von der Modellgröße, der Dauer des Herunterladens des Modells und der Startzeit des Containers variieren.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Min, Max, Probenanzahl, Perzentile

Dimensions for Endpoint Invocation Metrics (Dimensionen der Metriken für Endpunktaufrufe)

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

SageMaker Metriken für mehrere Modelle

DieAWS/SageMakerNamespace enthält das folgende Modell zum Laden von Metriken aus Aufrufen InvokeEndpoint.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Für Informationen darüber, wie lange CloudWatch Metriken werden beibehalten für, sieheGetMetricStatisticsin derAmazon CloudWatch API-Referenz.

Metriken zum Laden von Multimodell-Endpunktmodellen

Metrik Beschreibung
ModelLoadingWaitTime

Das Zeitintervall, über das hinweg eine Aufrufanforderung darauf gewartet hat, dass das Zielmodell heruntergeladen oder geladen wird, oder beides, um Interferenzen vorzunehmen.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

ModelUnloadingTime

Das Zeitintervall, das zum Entladen des Modells über den UnloadModel-API-Aufruf des Containers erforderlich war.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

ModelDownloadingTime

Das Zeitintervall, das zum Herunterladen des Modells von Amazon Simple Storage Service (Amazon S3) benötigt wurde.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

ModelLoadingTime

Das Zeitintervall, das zum Laden des Modells über den LoadModel-API-Aufruf des Containers erforderlich war.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

ModelCacheHit

Die Anzahl der InvokeEndpoint-Anforderungen, die an den Multimodell-Endpunkt gesendet werden, für die das Modell bereits geladen wurde.

Die Durchschnittsstatistik zeigt das Verhältnis der Anforderungen an, für die das Modell bereits geladen wurde.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe, Stichprobenanzahl

Dimensionen für Metriken zum Laden von Multimodell-Endpunktmodellen

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

Die /aws/sagemaker/Endpoints-Namespaces enthalten die folgenden Instance-Metriken aus Aufrufen an InvokeEndpoint.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Für Informationen darüber, wie lange CloudWatch Metriken werden beibehalten für, sieheGetMetricStatisticsin derAmazon CloudWatch API-Referenz.

Metriken für Multimodell-Endpunktmodell-Instances

Metrik Beschreibung
LoadedModelCount

Die Anzahl der Modelle, die in die Container des Multimodell-Endpunkts geladen werden. Diese Metrik wird pro Instance ausgegeben.

Die Durchschnittsstatistik mit einem Zeitraum von 1 Minute gibt Ihnen die durchschnittliche Anzahl der pro Instance geladenen Modelle an.

Die Summenstatistik gibt Ihnen die Gesamtzahl der Modelle an, die über alle Instances im Endpunkt geladen wurden.

Die Modelle, die von dieser Metrik verfolgt werden, sind nicht unbedingt eindeutig, da ein Modell möglicherweise in mehrere Container am Endpunkt geladen wird.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

Dimensionen für Metriken zum Laden von Multimodell-Endpunktmodellen

Dimension Beschreibung
EndpointName, VariantName

Filtert die Metriken für den Endpunktaufruf einer ProductionVariant für den angegebenen Endpunkt und die Variante.

SageMaker Jobs und Endpoint Metrics

Die/aws/sagemaker/ProcessingJobs,/aws/sagemaker/TrainingJobs,/aws/sagemaker/TransformJobs, und/aws/sagemaker/EndpointsNamespaces enthalten die folgenden Metriken für die Trainingsjobs und Endpunktinstanzen.

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Anmerkung

Amazon CloudWatch unterstützthochauflösende benutzerdefinierte Metrikenund seine beste Auflösung beträgt 1 Sekunde. Je feiner die Auflösung, desto kürzer ist jedoch die Lebensdauer des CloudWatch -Metriken. Für die 1-Sekunden-Frequenzauflösung ist der CloudWatch Metriken sind 3 Stunden lang verfügbar. Weitere Informationen zur Auflösung und Lebensdauer der CloudWatch Metriken, sieheGetMetricStatisticsin derAmazon CloudWatch API-Referenz.

Tipp

Wenn Sie Ihr Trainingsjob mit einer feineren Auflösung bis hinunter zu 100 Millisekunden (0,1 Sekunden) profilieren und die Trainingsmetriken unbegrenzt in Amazon S3 für benutzerdefinierte Analysen jederzeit speichern möchten, sollten Sie die Verwendung vonAmazon SageMaker Debugger. SageMaker Der Debugger bietet integrierte Regeln zur automatischen Erkennung häufiger Trainingsprobleme. Er erkennt Probleme mit der Auslastung der Hardwareressourcen (wie CPU-, GPU- und E/A-Engpässe) und nicht konvergierende Modellprobleme (wie Überanpassung, verschwindende Gradienten und explodierende Tensoren). SageMaker Debugger bietet auch Visualisierungen über Studio und seinen Profilerstellungsbericht. Informationen zum Erkunden der Debugger-Visualisierungen finden Sie unterSageMaker Exemplarische Vorgehensweise für das Debugger Insights,Exemplarische Vorgehensweise für den Debugger-Profilerstellungsbericht, undAnalysieren von Daten mit der SMDebug Client Library.

Processing Job, Training Job, Batch Transform Job, and Endpoint Instance Metrics (Verarbeitungsauftrag, Trainingsauftrag, Stapeltransformationsauftrag und Endpunkt-Instance-Metriken)

Metrik Beschreibung
CPUUtilization Die Summe der Auslastung jedes einzelnen CPU-Kerns. Die CPU-Auslastung jedes Kernbereichs beträgt 0—100. Wenn es zum Beispiel vier CPUs gibt, kann dieCPUUtilizationBereich liegt zwischen 0 und 400%. Bei der Verarbeitung von Aufträgen ist der Wert die CPU-Auslastung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die CPU-Auslastung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die CPU-Auslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der CPU-Auslastung von primären und ergänzenden Containern auf der Instance.

Anmerkung

Für Aufträge mit mehreren Instanzen meldet jede Instanz Metriken zur CPU-Auslastung Die Standardansicht in CloudWatch zeigt die durchschnittliche CPU-Auslastung über alle Instanzen hinweg.

Einheiten: Prozent

MemoryUtilization

Der Prozentsatz des Speichers, der von den Containern auf einer Instance belegt wird. Dieser Wertebereich liegt zwischen 0 und 100%.

Bei der Verarbeitung von Aufträgen ist der Wert die Speichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die Speichernutzung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die Speichernutzung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der Speichernutzung der primären und ergänzenden Container auf der Instance.

Einheiten: Prozent

Anmerkung

Für Aufträge mit mehreren Instanzen meldet jede Instanz Metriken zur Speicherauslastung. Die Standardansicht in CloudWatch zeigt die durchschnittliche Speicherauslastung über alle Instanzen hinweg.

GPUUtilization

Der Prozentsatz der GPU-Einheiten, die von den Containern auf einer Instance verwendet werden. Der Wert kann zwischen 0 und 100 liegen und wird mit der Anzahl der GPUs multipliziert. Wenn es beispielsweise vier GPUs gibt, wird dieGPUUtilizationBereich liegt zwischen 0 und 400%.

Bei der Verarbeitung von Aufträgen ist der Wert die GPU-Auslastung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die GPU-Auslastung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Auslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Auslastung von primären und ergänzenden Containern auf der Instance.

Anmerkung

Bei Aufträgen mit mehreren Instanzen meldet jede Instanz GPU-Auslastungsmetriken. Die Standardansicht in CloudWatch zeigt die durchschnittliche GPU-Auslastung über alle Instanzen hinweg.

Einheiten: Prozent

GPUMemoryUtilization

Der Prozentsatz des GPU-Speichers, der von den Containern auf einer Instance belegt wird. Der Wertebereich liegt zwischen 0 und 100 und wird mit der Anzahl der GPUs multipliziert. Wenn es beispielsweise vier GPUs gibt, wird dieGPUMemoryUtilizationBereich liegt zwischen 0 und 400%.

Bei Verarbeitungsaufträgen ist der Wert die GPU-Speichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die GPU-Speichernutzung des Algorithmus-Containers auf der Instance ab.

Bei Stapeltransformationsaufträgen bildet dieser Wert die GPU-Speicherauslastung des Umwandlungs-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der GPU-Speichernutzung der primären und ergänzenden Container auf der Instance.

Anmerkung

Bei Aufträgen mit mehreren Instanzen meldet jede Instanz Metriken zur GPU-Speicherauslastung. Die Standardansicht in CloudWatch zeigt die durchschnittliche GPU-Speicherauslastung über alle Instanzen hinweg an.

Einheiten: Prozent

DiskUtilization

Der Prozentsatz des Speicherplatzes, die von den Containern auf einer Instance verwendet werden. Dieser Wertebereich liegt zwischen 0 und 100%. Diese Metrik wird für Stapeltransformationsaufträge nicht unterstützt.

Bei Verarbeitungsaufträgen ist der Wert die Festplattenspeichernutzung des Verarbeitungscontainers auf der Instance.

Bei Schulungsaufträgen bildet dieser Wert die Speicherplatzauslastung des Algorithmus-Containers auf der Instance ab.

Bei Endpunktvarianten ist dieser Wert die Summe der Speicherplatzauslastung der primären und ergänzenden Container auf der Instance.

Einheiten: Prozent

Anmerkung

Für Aufträge mit mehreren Instanzen meldet jede Instanz Metriken zur Festplattenauslastung. Die Standardansicht in CloudWatch zeigt die durchschnittliche Festplattenauslastung über alle Instanzen hinweg an.

Dimensions for Processing Job, Training Job and Batch Transform Job Instance Metrics (Dimensionen für Verarbeitungsauftrags-, Trainingsauftrags- und Stapeltransformationsauftrags-Instance-Metriken)

Dimension Beschreibung
Host

Bei Verarbeitungsaufträgen wird der Wert für diese Dimension im Format [processing-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Metriken für angegebenen Verarbeitungsauftrag und Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/ProcessingJobs vorhanden.

Bei Schulungsaufträgen wird der Wert für diese Dimension im Format [training-job-name]/algo-[instance-number-in-cluster] angegeben. Mit dieser Dimension können Sie Instance-Metriken für den angegebenen Schulungsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/TrainingJobs vorhanden.

Bei Stapeltransformationsaufträgen wird der Wert für diese Dimension im Format [transform-job-name]/[instance-id] angegeben. Mit dieser Dimension können Sie Instance-Metriken für den angegebenen Stapeltransformationsauftrag und die Instance filtern. Dieses Dimensionsformat ist nur im Namespace /aws/sagemaker/TransformJobs vorhanden.

SageMaker Ground Truth Kennzahlen

Ground Truth Kennzahlen

Metrik Beschreibung
ActiveWorkers

Ein einzelner aktiver Mitarbeiter in einem privaten Arbeitsteam hat eine Aufgabe eingereicht, freigegeben oder abgelehnt. Verwenden Sie die Summenstatistik, um die Gesamtzahl der aktiven Mitarbeiter zu ermitteln. Ground Truth versucht jeden Einzelnen zu erlösenActiveWorkersEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der aktiven Mitarbeiter an

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

DatasetObjectsAutoAnnotated

Die Anzahl der Dataset-Objekte, die in einem Etikettierungsauftrag automatisch mit Anmerkungen versehen werden. Diese Metrik wird nur ausgegeben, wenn die automatisierte Etikettierung aktiviert ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

DatasetObjectsHumanAnnotated

Die Anzahl der Dataset-Objekte, die in einem Etikettierungsauftrag durch eine Person mit Anmerkungen versehen werden. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

DatasetObjectsLabelingFailed

Die Anzahl der Dataset-Objekte, deren Etikettierung in einem Etikettierungsauftrag fehlgeschlagen ist. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

JobsFailed

Ein einzelner Etikettierauftrag ist fehlgeschlagen. Um die Gesamtzahl der fehlgeschlagenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

JobsSucceeded

Ein einziger Etikettierauftrag war erfolgreich. Um die Gesamtzahl der erfolgreich durchgeführten Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

JobsStopped

Ein einziger Etikettierauftrag wurde gestoppt. Um die Gesamtzahl der angehaltenen Etikettierungsaufträge zu erhalten, verwenden Sie die Summenstatistik.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

TasksAccepted

Eine einzelne Aufgabe wurde von einem Arbeiter angenommen. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Arbeitern akzeptierten Aufgaben zu ermitteln. Ground Truth versucht jeden Einzelnen zu erlösenTaskAcceptedEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der akzeptierten Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

TasksDeclined

Eine einzelne Aufgabe wurde von einem Arbeiter abgelehnt. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Arbeitern abgelehnten Aufgaben zu ermitteln. Ground Truth versucht jeden Einzelnen zu erlösenTasksDeclinedEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der abgelehnten Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

TasksReturned

Eine einzelne Aufgabe wurde zurückgegeben. Verwenden Sie die Summenstatistik, um die Gesamtzahl der zurückgegebenen Aufgaben zu ermitteln. Ground Truth versucht jeden Einzelnen zu erlösenTasksReturnedEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der zurückgegebenen Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

TasksSubmitted

Eine einzelne Aufgabe wurde von einem privaten Mitarbeiter eingereicht/erledigt. Verwenden Sie die Summenstatistik, um die Gesamtzahl der von Arbeitern eingereichten Aufgaben zu ermitteln. Ground Truth versucht jeden Einzelnen zu erlösenTasksSubmittedEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzahl der übermittelten Aufgaben an.

Einheiten: Keine

Gültige Statistiken: Summe, Probenanzahl

TimeSpent

Zeit, die für eine von einem Privatarbeiter erledigte Aufgabe aufgewendet wurde. Diese Metrik beinhaltet nicht die Zeit, zu der ein Mitarbeiter eine Pause einlegte oder eine Pause einlegte. Ground Truth versucht, jeden zu liefernTimeSpentEreignis einmal. Wenn diese Lieferung nicht erfolgreich ist, gibt diese Metrik möglicherweise nicht die Gesamtzeit an, die aufgewendet wurde.

Einheiten: Sekunden

Gültige Statistiken: Summe, Probenanzahl

TotalDatasetObjectsLabeled

Die Anzahl der Dataset-Objekte, deren Etikettierung in einem Etikettierungsauftrag erfolgreich war. Um den Fortschritt des Etikettierungsauftrags anzuzeigen, verwenden Sie die Max-Metrik.

Einheiten: Keine

Gültige Statistiken: Max

Dimensionen für Dataset-Objektmetriken

Dimension Beschreibung
LabelingJobName

Filtert die Metriken für die Dataset-Objektanzahl eines Etikettierungsauftrags.

Amazon SageMaker Feature Store Metriken

Funktionen des Feature Store-Verbrau

Metrik Beschreibung
ConsumedReadRequestsUnits

Die Anzahl der verbrauchten Leseeinheiten in dem angegebenen Zeitraum. Sie können die verbrauchten Leseeinheiten für einen Feature-Store-Laufzeitvorgang und die zugehörige Feature-Gruppe abrufen.

Einheiten: Keine

Gültige Statistiken: Alle

ConsumedWriteRequestsUnits

Die Anzahl der verbrauchten Schreibeinheiten in dem angegebenen Zeitraum. Sie können die verbrauchten Schreibeinheiten für eine Feature-Store-Laufzeitoperation und die zugehörige Feature-Gruppe abrufen.

Einheiten: Keine

Gültige Statistiken: Alle

Dimensionen für Feature Store-Verbrauchsmetriken

Dimension Beschreibung
FeatureGroupName, OperationName

Filtert Metriken des Feature-Store-Laufzeitverbrauchs der Feature-Gruppe und des von Ihnen angegebenen Vorgangs

Betriebsmetriken des Feature

Metrik Beschreibung
Invocations

Die Anzahl der Anforderungen, die in dem angegebenen Zeitraum an die Feature-Store-Laufzeitoperationen gestellt wurden.

Einheiten: Keine

Gültige Statistiken: Summe

Operation4XXErrors

Die Anzahl der Anforderungen an die Feature Store-Laufzeitvorgänge, bei denen der Vorgang einen 4xx-HTTP-Antwortcode zurückgegeben hat. Für jede 4xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Operation5XXErrors

Die Anzahl der Anforderungen an die Feature-Store-Laufzeitoperationen, bei denen der Vorgang einen 5xx-HTTP-Antwortcode zurückgegeben hat. Für jede 5xx-Antwort wird der Wert 1 gesendet, andernfalls 0.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

ThrottledRequests

Die Anzahl der Anforderungen an die Feature-Store-Laufzeitoperationen, bei denen die Anforderung gedrosselt wurde. Für jede gedrosselte Anforderung wird 1 gesendet, andernfalls wird 0 gesendet.

Einheiten: Keine

Gültige Statistiken: Durchschnitt, Summe

Latency

Das Zeitintervall für die Verarbeitung von Anforderungen an die Feature Store-Laufzeitvorgänge. Dieses Intervall wird ab der Zeit gemessen SageMaker empfängt die Anforderung, bis sie eine Antwort an den Client zurückgibt.

Einheiten: Mikrosekunden

Gültige Statistiken: Durchschnitt, Summe, Min, Max, Probenanzahl, Perzentile

Dimensionen für Betriebsmetriken des Feature Store

Dimension Beschreibung

FeatureGroupName, OperationName

Filtert Betriebsmetriken der Feature-Store-Laufzeit der Feature-Gruppe und des von Ihnen angegebenen Vorgangs. Sie können diese Dimensionen für Nicht-Batch-Operationen verwenden, z. GetRecord, PutRecord, und DeleteRecord.
OperationName

Filtert Betriebsmetriken für den Feature Store Runtime für den von Ihnen angegebenen Vorgang. Sie können diese Dimension für Batch-Operationen verwenden, wie BatchGetRecord.

SageMaker Pipeles-Met

DieAWS/Sagemaker/ModelBuildingPipeline-Namespace enthält die folgenden Metriken für Pipeline-Ausführungen.

Zwei Kategorien von Pipeline-Ausführungsmetriken sind verfügbar:

  • Ausführungsmetriken für alle Pipelines— Kennzahlen zur Pipeline-Ausführung auf Kontoebene (für alle Pipelines im Girokonto)

  • Ausführungsmetriken nach Pipeline— Kennzahlen zur Pipeline-Ausführung pro Pipeline

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Änderungen der Befehlszustands

Metrik Beschreibung
ExecutionStarted

Die Anzahl der gestarteten Pipeline-Ausführungen.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionFailed

Die Anzahl der fehlgeschlagenen Pipeline-Ausführung.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionSucceeded

Die Anzahl der erfolgreichen Pipeline-Ausführungen.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionStopped

Die Anzahl der Pipeline-Ausführungen, die gestoppt wurden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

ExecutionDuration

Die Dauer in Millisekunden, die die Pipeline-Ausführung ausgeführt hat.

Einheiten: Millisekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

Dimensionen für Ausführungsmetriken nach Pipeline

Dimension Beschreibung
PipelineName

Filtert Pipeline-Ausführungsmetriken für eine angegebene Pipeline

Taktmetriken

DieAWS/Sagemaker/ModelBuildingPipeline-Namespace enthält die folgenden Metriken für Pipeline-Schritte

Die Metriken sind mit einer einminütigen Frequenz verfügbar.

Metrik Beschreibung
StepStarted

Die Anzahl der Schritte, die gestartet wurden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepFailed

Die Anzahl der fehlgeschlagenen Schritte.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepSucceeded

Die Anzahl der Schritte, die erfolgreich waren.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepStopped

Die Anzahl der Schritte, die angehalten wurden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Summe

StepDuration

Die Dauer der Ausführung des Schritts in Millisekunden.

Einheiten: Millisekunden

Gültige Statistiken: Durchschnitt, Sample-Count, Sample-Anzahl, Samp

Schrittmetriken für Dimensionen für

Dimension Beschreibung
PipelineName, StepName

Filtert Schrittmetriken für eine angegebene Pipeline und einen bestimmten Schritt