Métriques Hadoop et Spark dans Ganglia - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Métriques Hadoop et Spark dans Ganglia

Note

La dernière version d’Amazon EMR à inclure Ganglia était Amazon EMR 6.15.0. Pour surveiller votre cluster, les versions supérieures à 6.15.0 incluent l'agent Amazon CloudWatch .

Ganglia fournit des rapports sur les métriques Hadoop pour chaque instance. Les différents types de métriques sont préfixés par catégorie : système de fichiers distribué (dfs.*), machine virtuelle Java (jvm.*), (mapred.*) et appels de procédure MapReduce distante (rpc.*).

Les métriques Ganglia basées sur YARN, telles que Spark et Hadoop, ne sont pas disponibles pour les versions EMR 4.4.0 et 4.5.0. Utilisez une version ultérieure pour employer ces métriques.

Les métriques de Ganglia pour Spark ont généralement des préfixes pour l'ID d'application YARN et Spark DAGScheduler. Ainsi, les préfixes suivent ce format :

  • DAGScheduler.*

  • application_xxxxxxxxxx_xxxx.driver.*

  • application_xxxxxxxxxx_xxxx.executor.*