Parametri Hadoop e Spark in Ganglia

Nota

L'ultima versione di Amazon EMR a includere Ganglia è stata Amazon EMR 6.15.0. Per monitorare il cluster, le versioni successive alla 6.15.0 includono l'agente Amazon CloudWatch .

Ganglia riporta i parametri Hadoop per ogni istanza. I vari tipi di metriche sono preceduti da categorie: file system distribuito (dfs.*), macchina virtuale Java (jvm.*), (mapred.*) e chiamate di procedura remota MapReduce (rpc.*).

I parametri di Ganglia basati su YARN, quali Spark e Hadoop, non sono disponibili per EMR versione 4.4.0 e 4.5.0. Scegliere una versione successiva per utilizzare questi parametri.

Le metriche Ganglia per Spark generalmente hanno prefissi per YARN application ID e Spark. DAGScheduler I prefissi seguono quindi questa forma:

DAGScheduler.*
application_xxxxxxxxxx_xxxx.driver.*
application_xxxxxxxxxx_xxxx.executor.*

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Visualizzazione dei parametri di Ganglia

Cronologia delle versioni di Ganglia