Wie verwende ich die Amazon-EMR-Metriken?CloudWatch Zugriffsmetriken für Amazon EMR Von Amazon EMR gemeldete Metriken in CloudWatch

Überwachung von Amazon EMR-Metriken mit CloudWatch

Die Metriken werden alle fünf Minuten aktualisiert und automatisch erfasst und CloudWatch für jeden Amazon EMR-Cluster weitergeleitet. Dieses Intervall kann nicht konfiguriert werden. Für die unter angegebenen Amazon EMR-Metriken fallen keine Gebühren an CloudWatch. Diese fünfminütigen Datenpunktmetriken werden 63 Tage lang archiviert. Danach werden die Daten verworfen.

Wie verwende ich die Amazon-EMR-Metriken?

Die folgende Tabelle zeigt die häufigsten Verwendungen von Metriken, die von Amazon EMR gemeldet werden. Es handelt sich dabei um Vorschläge für den Einstieg und nicht um eine umfassende Liste. Eine Liste der gesamten Metriken, die von Amazon EMR gemeldet werden, finden Sie unter Von Amazon EMR gemeldete Metriken in CloudWatch.

Wie gehe ich vor?	Relevante Metriken
Verfolgen des Cluster-Fortschritts	Sehen Sie sich die Metriken `RunningMapTasks`, `RemainingMapTasks`, `RunningReduceTasks` und `RemainingReduceTasks` an.
Erkennen von Clustern im Leerlauf	Die `IsIdle`-Metrik verfolgt, ob ein Cluster verfügbar ist, aber aktuell keine Aufgaben ausführt. Sie können einen Alarm einrichten, wenn sich der Cluster für einen bestimmten Zeitraum im Leerlauf befunden hat z. B. 30 Minuten.
Erkennen, wenn ein Knoten zu wenig Speicherplatz hat	Die `MRUnhealthyNodes`-Metrik verfolgt, wann einem oder mehreren Core- oder Aufgabenknoten der lokale Festplattenspeicher ausgeht und sie in einen `UNHEALTHY`-YARN-Status übergehen. Zum Beispiel haben Core- oder Aufgabenknoten nur noch wenig Speicherplatz zur Verfügung und sie können keine Aufgaben ausführen.
Erkennen, wenn ein Cluster zu wenig Speicherplatz hat	Die `HDFSUtilization`-Metrik überwacht die kombinierte HDFS-Kapazität des Clusters und kann eine Größenänderung des Clusters erfordern, um weitere Core-Knoten hinzuzufügen. Beispielsweise ist die HDFS-Auslastung hoch, was sich auf Aufträge und den Zustand des Clusters auswirken kann.
Erkennt, wenn ein Cluster mit reduzierter Kapazität läuft	Die `MRLostNodes`-Metrik verfolgt, wann ein oder mehrere Core- oder Aufgabenknoten nicht mit dem Hauptknoten kommunizieren können. Beispielsweise ist der Core- oder Aufgabenknoten für den Hauptknoten nicht erreichbar.

Weitere Informationen erhalten Sie unter Der Amazon EMR-Cluster endet mit NO_SLAVE_LEFT und den Kernknoten FAILED_BY_MASTER und AWSSupport-AnalyzeEMRLogs.

CloudWatch Zugriffsmetriken für Amazon EMR

Sie können die Metriken, an die Amazon EMR berichtet, CloudWatch mithilfe der Amazon EMR-Konsole oder der CloudWatch Konsole anzeigen. Sie können Metriken auch mit dem CloudWatch CLI-Befehl mon-get-stats oder der CloudWatch GetMetricStatistics API abrufen. Weitere Informationen zum Anzeigen oder Abrufen von Metriken für Amazon EMR finden CloudWatch Sie im CloudWatch Amazon-Benutzerhandbuch.

Von Amazon EMR gemeldete Metriken in CloudWatch

In den folgenden Tabellen sind die Metriken aufgeführt, die Amazon EMR in der Konsole meldet und an die sie weiterleitet. CloudWatch

Amazon-EMR-Metriken

Amazon EMR sendet Daten für verschiedene Metriken an CloudWatch. Alle Amazon-EMR-Cluster senden automatisch Metriken in Intervallen von fünf Minuten. Die Metriken werden für zwei Wochen archiviert. Nach Ablauf dieses Zeitraums werden die Daten verworfen.

Der AWS/ElasticMapReduce-Namespace enthält die folgenden Metriken.

Anmerkung

Amazon EMR ruft Metriken aus einem Cluster ab. Wenn die Verbindung zu einem Cluster verloren geht, werden keine Metriken gemeldet, bis der Cluster wieder verfügbar ist.

Die folgenden Metriken sind für Cluster mit Hadoop 2.x -Versionen verfügbar.

Metrik	Description
Cluster-Status
IsIdle	Gibt an, dass ein Cluster keine Arbeiten mehr ausführt, aber unverändert aktiv ist und Kosten verursacht. Der Wert beträgt 1, wenn weder Tasks noch Aufträge ausgeführt werden, andernfalls beträgt der Wert 0. Dieser Wert wird in 5-Minuten-Intervallen geprüft. Wenn der Wert 1 beträgt, bedeutet dies, dass der Cluster zum Zeitpunkt der Prüfung ungenutzt war, aber nicht die gesamten fünf Minuten. Um Falschmeldungen zu vermeiden, sollten Sie einen Alarm auslösen, wenn dieser Wert in mehreren aufeinander folgenden 5-Minuten-Prüfungen 1 beträgt. Sie können zum Beispiel einen Alarm auslösen, wenn dieser Wert 30 Minuten oder länger 1 beträgt. Anwendungsfall: Cluster-Leistung überwachen Einheiten: boolescher Wert
ContainerAllocated	Die Anzahl der Ressourcencontainer, die von der ResourceManager zugewiesen wurden. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
ContainerReserved	Anzahl der reservierten Container. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
ContainerPending	Anzahl der Container in der Warteschlange, die noch nicht zugeordnet worden sind. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
ContainerPendingRatio	Das Verhältnis von ausstehenden Containern zu zugewiesenen Containern (ContainerPendingRatio = ContainerPending / ContainerAllocated). Wenn ContainerAllocated = 0, dann ContainerPendingRatio =ContainerPending. Der Wert von ContainerPendingRatio steht für eine Zahl, nicht für einen Prozentsatz. Dieser Wert ist zum Skalieren von Cluster-Ressourcen anhand des Zuordnungsverhaltens des Containers hilfreich. Einheiten: Anzahl
AppsCompleted	Anzahl der an YARN übermittelten abgeschlossenen Anwendungen. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
AppsFailed	Anzahl der an YARN übermittelten Anwendungen, deren Abschluss fehlgeschlagen ist. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
AppsKilled	Anzahl der an YARN übermittelten Anwendungen, die beendet worden sind. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
AppsPending	Anzahl der an YARN übermittelten Anwendungen, die sich im ausstehenden Zustand befinden. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
AppsRunning	Anzahl der an YARN übermittelten Anwendungen, die ausgeführt werden. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
AppsSubmitted	Anzahl der an YARN übermittelten Anwendungen. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
Knotenstatus
CoreNodesRunning	Anzahl der arbeitenden Core-Knoten. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
CoreNodesPending	Anzahl der Core-Knoten, die auf eine Zuordnung warten. Es müssen nicht alle angeforderten Core-Knoten sofort verfügbar sein. Diese Metrik gibt die ausstehenden Anforderungen an. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
LiveDataNodes	Prozentsatz der Datenknoten, die Arbeit von Hadoop empfangen. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Prozent
MRTotalNodes	Die Anzahl der Knoten, die derzeit für MapReduce Jobs verfügbar sind. Entspricht der YARN-Metrik `mapred.resourcemanager.TotalNodes`. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl Hinweis: Zählt MRTotalNodes nur die derzeit aktiven Knoten im System. YARN entfernt terminierte Knoten automatisch aus dieser Anzahl und beendet deren Verfolgung, sodass sie in der MRTotalNodes Metrik nicht berücksichtigt werden.
MRActiveNodes	Die Anzahl der Knoten, auf denen derzeit MapReduce Aufgaben oder Jobs ausgeführt werden. Entspricht der YARN-Metrik `mapred.resourcemanager.NoOfActiveNodes`. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MRLostNodes	Die Anzahl der Knoten, MapReduce denen der Status LOST zugewiesen wurde. Entspricht der YARN-Metrik `mapred.resourcemanager.NoOfLostNodes`. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
MRUnhealthyNodes	Die Anzahl der Knoten, die für MapReduce Jobs mit dem Status UNHEALTHY verfügbar sind. Entspricht der YARN-Metrik `mapred.resourcemanager.NoOfUnhealthyNodes`. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MRDecommissionedNodes	Die Anzahl der Knoten, die MapReduce Anwendungen zugewiesen sind, die den Status STILLGELEGT haben. Entspricht der YARN-Metrik `mapred.resourcemanager.NoOfDecommissionedNodes`. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
MRRebootedNodes	Die Anzahl der verfügbaren Knoten MapReduce , die neu gestartet und mit dem Status REBOOTED markiert wurden, zur Verfügung stehen. Entspricht der YARN-Metrik `mapred.resourcemanager.NoOfRebootedNodes`. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
MultiMasterInstanceGroupNodesRunning	Die Anzahl der zurzeit ausgeführten Master-Knoten. Anwendungsfall: Überwachen von Ausfall und Ersetzung eines Master-Knotens Einheiten: Anzahl
MultiMasterInstanceGroupNodesRunningPercentage	Der Prozentsatz der zurzeit im Verhältnis zur angeforderten Instance-Zahl für Master-Knoten ausgeführten Master-Knoten. Anwendungsfall: Überwachen von Ausfall und Ersetzung eines Master-Knotens Einheiten: Prozent
MultiMasterInstanceGroupNodesRequested	Die Anzahl der angeforderten Master-Knoten. Anwendungsfall: Überwachen von Ausfall und Ersetzung eines Master-Knotens Einheiten: Anzahl
IO
S3BytesWritten	Anzahl der auf Amazon S3 geschriebenen Bytes. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
S3BytesRead	Anzahl der von Amazon S3 gelesenen Bytes. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
HDFSUtilization	Prozentsatz des gegenwärtig benutzten HDFS-Speichers. Anwendungsfall: Cluster-Leistung analysieren Einheiten: Prozent
HDFSBytesRead	Anzahl der von HDFS gelesenen Byte. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
HDFSBytesWritten	Anzahl der auf HDFS geschriebenen Byte. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
MissingBlocks	Anzahl der Blöcke, in denen HDFS keine Replicas hat. Hierbei kann es sich um beschädigte Blöcke handeln. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
CorruptBlocks	Anzahl der Blöcke, die von HDFS als beschädigt angegeben werden. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
TotalLoad	Gesamtanzahl der gleichzeitigen Datenübertragungen. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
MemoryTotalMB	Gesamtgröße des Speichers im Cluster. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MemoryReservedMB	Größe des reservierten Speichers. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MemoryAvailableMB	Verfügbarer zuzuordnender Speicher. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
YARNMemoryAvailablePercentage	Der Prozentsatz des verbleibenden Speichers, der für YARN verfügbar ist (YARNMemoryAvailablePercentage = MemoryAvailable MB/MemoryTotalMB). Dieser Wert ist zum Skalieren von Cluster-Ressourcen anhand der YARN-Speichernutzung hilfreich. Einheiten: Prozent
MemoryAllocatedMB	Menge des dem Cluster zugeordneten Speichers. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
PendingDeletionBlocks	Anzahl der zum Löschen gekennzeichneten Blöcke. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
UnderReplicatedBlocks	Anzahl der Blöcke, die nochmals repliziert werden müssen. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
DfsPendingReplicationBlocks	Status der Blockreplikation: replizierte Blöcke, Alter der Replikationsanforderung und nicht erfolgreiche Replikationsanforderungen. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl
CapacityRemainingGB	Gesamtbetrag der verbleibenden HDFS-Festplattenkapazität. Anwendungsfall: Cluster-Fortschritt überwachen, Cluster-Zustand überwachen Einheiten: Anzahl

Nachfolgend sind die Hadoop 1-Metriken aufgeführt:

Metrik	Description
Cluster-Status
IsIdle	Gibt an, dass ein Cluster keine Arbeiten mehr ausführt, aber unverändert aktiv ist und Kosten verursacht. Der Wert beträgt 1, wenn weder Tasks noch Aufträge ausgeführt werden, andernfalls beträgt der Wert 0. Dieser Wert wird in 5-Minuten-Intervallen geprüft. Wenn der Wert 1 beträgt, bedeutet dies, dass der Cluster zum Zeitpunkt der Prüfung ungenutzt war, aber nicht die gesamten fünf Minuten. Um Falschmeldungen zu vermeiden, sollten Sie einen Alarm auslösen, wenn dieser Wert in mehreren aufeinander folgenden 5-Minuten-Prüfungen 1 beträgt. Sie können zum Beispiel einen Alarm auslösen, wenn dieser Wert 30 Minuten oder länger 1 beträgt. Anwendungsfall: Cluster-Leistung überwachen Einheiten: boolescher Wert
JobsRunning	Anzahl der Aufträge im Cluster, die gegenwärtig ausgeführt werden. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
JobsFailed	Anzahl der fehlgeschlagenen Aufträge im Cluster. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
Map/Reduce
MapTasksRunning	Anzahl der Map-Tasks für jeden Auftrag. Wenn Sie einen Scheduler installiert haben und mehrere Aufträge ausführen, werden mehrere Grafiken erstellt. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MapTasksRemaining	Anzahl der verbleibenden Map-Tasks für jeden Auftrag. Wenn Sie einen Scheduler installiert haben und mehrere Aufträge ausführen, werden mehrere Grafiken erstellt. Eine verbleibende Map-Task ist eine Task, die sich in keinem der folgenden Zustände befindet: Running, Killed oder Completed. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
MapSlotsOpen	Ungenutzte Kapazität für Map-Tasks. Dies wird als die maximale Anzahl von Map-Tasks für einen bestimmten Cluster abzüglich der Gesamtanzahl der gegenwärtig ausgeführten Map-Tasks in diesem Cluster berechnet. Anwendungsfall: Cluster-Leistung analysieren Einheiten: Anzahl
RemainingMapTasksPerSlot	Das Verhältnis der insgesamt verbleibenden Map-Tasks, bezogen auf die insgesamt verfügbaren Map-Slots im Cluster. Anwendungsfall: Cluster-Leistung analysieren Einheiten: Verhältnis
ReduceTasksRunning	Anzahl der laufenden Reduce-Tasks für jeden Auftrag. Wenn Sie einen Scheduler installiert haben und mehrere Aufträge ausführen, werden mehrere Grafiken erstellt. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
ReduceTasksRemaining	Anzahl der verbleibenden Reduce-Tasks für jeden Auftrag. Wenn Sie einen Scheduler installiert haben und mehrere Aufträge ausführen, werden mehrere Grafiken erstellt. Anwendungsfall: Cluster-Fortschritt überwachen Einheiten: Anzahl
ReduceSlotsOpen	Ungenutzte Kapazität für Reduce-Tasks. Dies wird als die maximale Anzahl von Reduce-Tasks für einen bestimmten Cluster abzüglich der Gesamtanzahl der gegenwärtig ausgeführten Reduce-Tasks in diesem Cluster berechnet. Anwendungsfall: Cluster-Leistung analysieren Einheiten: Anzahl
Knotenstatus
CoreNodesRunning	Anzahl der arbeitenden Core-Knoten. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
CoreNodesPending	Anzahl der Core-Knoten, die auf eine Zuordnung warten. Es müssen nicht alle angeforderten Core-Knoten sofort verfügbar sein. Diese Metrik gibt die ausstehenden Anforderungen an. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
LiveDataNodes	Prozentsatz der Datenknoten, die Arbeit von Hadoop empfangen. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Prozent
TaskNodesRunning	Anzahl der arbeitenden Aufgabenknoten. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
TaskNodesPending	Anzahl der Aufgabenknoten, die auf eine Zuordnung warten. Es müssen nicht alle angeforderten Aufgabenknoten sofort verfügbar sein. Diese Metrik gibt die ausstehenden Anforderungen an. Die Datenpunkte dieser Metrik werden nur dann angegeben, wenn die zugehörige Instance-Gruppe existiert. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
LiveTaskTrackers	Prozentsatz der funktionierenden Task-Tracker. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Prozent
IO
S3BytesWritten	Anzahl der auf Amazon S3 geschriebenen Bytes. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
S3BytesRead	Anzahl der von Amazon S3 gelesenen Bytes. Diese Metrik aggregiert nur MapReduce Jobs und gilt nicht für andere Workloads in Amazon EMR. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
HDFSUtilization	Prozentsatz des gegenwärtig benutzten HDFS-Speichers. Anwendungsfall: Cluster-Leistung analysieren Einheiten: Prozent
HDFSBytesRead	Anzahl der von HDFS gelesenen Byte. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
HDFSBytesWritten	Anzahl der auf HDFS geschriebenen Byte. Anwendungsfall: Cluster-Leistung analysieren, Cluster-Fortschritt überwachen Einheiten: Anzahl
MissingBlocks	Anzahl der Blöcke, in denen HDFS keine Replicas hat. Hierbei kann es sich um beschädigte Blöcke handeln. Anwendungsfall: Cluster-Zustand überwachen Einheiten: Anzahl
TotalLoad	Die aktuelle Gesamtzahl der Leser und Autoren, die von allen Benutzern DataNodes in einem Cluster gemeldet wurden. Anwendungsfall: Stellen Sie fest, inwieweit ein hoher Wert zu einer schlechten Leistung bei der Auftragsausführung beitragen I/O könnte. Worker-Knoten, auf denen der DataNode Daemon ausgeführt wird, müssen auch Mapping- und Reduce-Aufgaben ausführen. Dauerhaft hohe TotalLoad Werte im Laufe der Zeit können darauf hindeuten, dass hohe Werte I/O möglicherweise zu einer schlechten Leistung beitragen. Gelegentliche Spitzen in diesem Wert sind typisch und weisen in der Regel nicht auf ein Problem hin. Einheiten: Anzahl

Cluster-Kapazitätsmetriken

Die folgenden Metriken geben die aktuelle oder Zielkapazitäten eines Clusters an. Diese Metriken sind nur verfügbar, wenn verwaltete Skalierung oder automatische Beendigung aktiviert ist.

Bei Clustern, die aus Instance-Flotten bestehen, werden die Cluster-Kapazitätsmetriken in Units gemessen. Bei Clustern, die aus Instance-Gruppen bestehen, werden die Clusterkapazitätsmetriken in Nodes oder VCPU basierend auf dem Einheitentyp gemessen, der in der Richtlinie für verwaltete Skalierung verwendet wird. Weitere Informationen finden Sie unter Using EMR-managed Scaling im Amazon EMR Management Guide.

Metrik	Description
`TotalUnitsRequested` `TotalNodesRequested` `TotalVCPURequested`	Die Zielgesamtanzahl von units/nodes /vCPUs in einem Cluster, wie sie durch verwaltete Skalierung bestimmt wird. Einheiten: Anzahl
`TotalUnitsRunning` `TotalNodesRunning` `TotalVCPURunning`	Die aktuelle Gesamtzahl der units/nodes /vCPUs, die in einem laufenden Cluster verfügbar sind. Wenn eine Clustergrößenänderung angefordert wird, wird diese Metrik aktualisiert, nachdem die neuen Instances hinzugefügt oder aus dem Cluster entfernt wurden. Einheiten: Anzahl
`CoreUnitsRequested` `CoreNodesRequested` `CoreVCPURequested`	Die Zielanzahl von CORE units/nodes /vCPUs in einem Cluster, wie sie durch verwaltete Skalierung bestimmt wird. Einheiten: Anzahl
`CoreUnitsRunning` `CoreNodesRunning` `CoreVCPURunning`	Die aktuelle Anzahl von CORE units/nodes /vCPUs, die in einem Cluster ausgeführt werden. Einheiten: Anzahl
`TaskUnitsRequested` `TaskNodesRequested` `TaskVCPURequested`	Die Zielanzahl von TASK units/nodes /vCPUs in einem Cluster, wie sie durch verwaltete Skalierung bestimmt wird. Einheiten: Anzahl
`TaskUnitsRunning` `TaskNodesRunning` `TaskVCPURunning`	Die aktuelle Anzahl von TASK units/nodes /vCPUs, die in einem Cluster ausgeführt werden. Einheiten: Anzahl

Amazon EMR gibt die folgenden Metriken mit einer Granularität von einer Minute aus, wenn Sie die automatische Kündigung mithilfe einer Richtlinie zur automatischen Kündigung aktivieren. Einige Metriken sind nur für Amazon-EMR-Versionen 6.4.0 und höher verfügbar. Weitere Informationen zur automatischen Beendigung finden Sie unter Verwenden einer automatischen Terminierungsrichtlinie für die Amazon EMR-Clusterbereinigung.

Metrik Description

Metrik	Description
`TotalNotebookKernels`	Die Gesamtzahl der laufenden und inaktiven Notebook-Kernel auf dem Cluster. Diese Metrik ist nur für Amazon-EMR-Versionen 6.4.0 und höher verfügbar.
`AutoTerminationIsClusterIdle`	Gibt an, ob der Cluster verwendet wird. Der Wert 0 gibt an, dass der Cluster von einer der folgenden Komponenten aktiv verwendet wird: Eine YARN-Anwendung HDFS Ein Notebook Eine Cluster-Benutzeroberfläche, z. B. der Spark History Server Ein Wert von 1 gibt an, dass sich der Cluster im Leerlauf befindet. Amazon EMR prüft, ob der Cluster kontinuierlich inaktiv ist (`AutoTerminationIsClusterIdle`= 1). Wenn die Leerlaufzeit eines Clusters dem `IdleTimeout`-Wert in Ihrer Richtlinie zur automatischen Kündigung entspricht, beendet Amazon EMR den Cluster.

TotalNotebookKernels

Die Gesamtzahl der laufenden und inaktiven Notebook-Kernel auf dem Cluster.

Diese Metrik ist nur für Amazon-EMR-Versionen 6.4.0 und höher verfügbar.

AutoTerminationIsClusterIdle

Gibt an, ob der Cluster verwendet wird.

Der Wert 0 gibt an, dass der Cluster von einer der folgenden Komponenten aktiv verwendet wird:

Eine YARN-Anwendung
HDFS
Ein Notebook
Eine Cluster-Benutzeroberfläche, z. B. der Spark History Server

Ein Wert von 1 gibt an, dass sich der Cluster im Leerlauf befindet. Amazon EMR prüft, ob der Cluster kontinuierlich inaktiv ist (AutoTerminationIsClusterIdle= 1). Wenn die Leerlaufzeit eines Clusters dem IdleTimeout-Wert in Ihrer Richtlinie zur automatischen Kündigung entspricht, beendet Amazon EMR den Cluster.

Dimensionen für Amazon-EMR-Metriken

Die Amazon-EMR-Daten können mithilfe der folgenden Dimensionen in der folgenden Tabelle gefiltert werden.

Dimension	Description
JobFlowId	Entspricht der Cluster-ID, der eindeutigen Kennung eines Clusters mit dem Format `j-XXXXXXXXXXXXX`. Sie können diesen Wert durch Klicken auf den Cluster in der Amazon-EMR-Konsole anzeigen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

CloudWatch Ereignisse und Metriken von Amazon EMR

Überwachen von Ereignissen