Überwachen interaktiver Endpunkte - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen interaktiver Endpunkte

Mit Amazon EMR auf EKS Version 6.10 und höher senden interaktive Endpunkte CloudWatch Amazon-Metriken zur Überwachung und Fehlerbehebung von Kernel-Lebenszyklusvorgängen aus. Metriken werden durch interaktive Clients wie EMR Studio oder selbst gehostete Jupyter-Notebooks ausgelöst. Jedem Vorgang, der von interaktiven Endpunkten unterstützt wird, sind Metriken zugeordnet. Die Vorgänge werden als Dimensionen für jede Metrik modelliert, wie in der folgenden Tabelle dargestellt. Von interaktiven Endpunkten ausgegebene Metriken sind in Ihrem Konto unter einem benutzerdefinierten Namespace sichtbar. EMRContainers

Metrik Beschreibung Einheit

RequestCount

Gesamtzahl der Anfragen eines Vorgangs, die vom interaktiven Endpunkt verarbeitet wurden.

Anzahl

RequestLatency

Der Zeitpunkt, zu dem eine Anfrage am interaktiven Endpunkt eingetroffen ist und eine Antwort vom interaktiven Endpunkt gesendet wurde.

Millisekunde

4 XXError

Wird ausgegeben, wenn eine Anforderung für einen Vorgang bei der Verarbeitung zu einem 4xx-Fehler führt.

Anzahl

5 XXError

Wird ausgegeben, wenn eine Anforderung für einen Vorgang zu einem serverseitigen 5XXX-Fehler führt.

Anzahl

KernelLaunchSuccess

Gilt nur für die CreateKernel Operation. Es gibt die Gesamtzahl der Kernelstarts an, die bis einschließlich dieser Anforderung erfolgreich waren.

Anzahl

KernelLaunchFailure

Gilt nur für die CreateKernel Operation. Es gibt die Gesamtzahl der Fehler beim Starten des Kernels bis einschließlich dieser Anforderung an.

Anzahl

Jeder interaktiven Endpunktmetrik sind die folgenden Dimensionen zugeordnet:

  • ManagedEndpointId – Bezeichner für den interaktiven Endpunkt

  • OperationName – Der vom interaktiven Client ausgelöste Vorgang

Mögliche Werte für die OperationName-Dimension werden in der folgenden Tabelle aufgeführt:

operationName Beschreibung des Vorgangs

CreateKernel

Fordert an, dass der interaktive Endpunkt einen Kernel startet.

ListKernels

Fordern Sie an, dass der interaktive Endpunkt die Kernel auflistet, die zuvor mit demselben Sitzungstoken gestartet wurden.

GetKernel

Fordern Sie an, dass der interaktive Endpunkt Details zu einem bestimmten Kernel erhält, der zuvor gestartet wurde.

ConnectKernel

Fordert den interaktiven Endpunkt auf, die Konnektivität zwischen dem Notebook-Client und dem Kernel herzustellen.

ConfigureKernel

Veröffentlichen Sie %%configure magic request auf einem Pyspark-Kernel.

ListKernelSpecs

Fordern Sie an, dass der interaktive Endpunkt die verfügbaren Kernel-Spezifikationen auflistet.

GetKernelSpec

Fordern Sie an, dass der interaktive Endpunkt die Kernel-Spezifikationen eines Kernels erhält, der zuvor gestartet wurde.

GetKernelSpecResource

Fordern Sie an, dass der interaktive Endpunkt spezifische Ressourcen erhält, die mit den zuvor gestarteten Kernel-Spezifikationen verknüpft sind.

Beispiele

Um auf die Gesamtzahl der Kernel zuzugreifen, die an einem bestimmten Tag für einen interaktiven Endpunkt gestartet wurden, gehen Sie wie folgt vor:

  1. Wählen Sie den benutzerdefinierten Namespace aus: EMRContainers

  2. Wählen Sie ManagedEndpointId, OperationName – CreateKernel

  3. RequestCount-Metrik mit der Statistik SUM und dem Zeitraum 1 day liefert alle Kernel-Startanfragen der letzten 24 Stunden.

  4. KernelLaunchSuccess Die Metrik mit Statistik SUM und Zeitraum 1 day liefert alle erfolgreichen Kernel-Startanfragen der letzten 24 Stunden.

Um auf die Anzahl der Kernelfehler für einen interaktiven Endpunkt an einem bestimmten Tag zuzugreifen:

  1. Wählen Sie den benutzerdefinierten Namespace aus: EMRContainers

  2. Wählen Sie ManagedEndpointId, OperationName – CreateKernel

  3. KernelLaunchFailure-Metrik mit der Statistik SUM und dem Zeitraum 1 day liefert alle fehlgeschlagenen Kernel-Startanfragen der letzten 24 Stunden. Sie können auch die 4XXError- und 5XXError-Metrik auswählen, um zu erfahren, welche Art von Kernelstartfehler aufgetreten ist.