Protokolldateien auf dem Primärknoten anzeigen In Amazon S3 archivierte Protokolldateien anzeigen

Amazon EMR-Protokolldateien anzeigen

Sowohl Amazon EMR als auch Hadoop erstellen Protokolldateien, die Aufschluss über den jeweiligen Status des Clusters geben. Standardmäßig werden diese Dateien im Primärknoten im /mnt/var/log/-Verzeichnis gespeichert. Abhängig von der Konfiguration Ihres Clusters beim Start können diese Protokolle auch in Amazon S3 archiviert und über das grafische Debugging-Tool angezeigt werden.

Es gibt viele Arten von Protokollen, die auf dem Primärknoten gespeichert werden. Amazon EMR schreibt Schritt- und Bootstrap-Aktions- und Instance-Status-Protokolle. Apache Hadoop erstellt Protokolle mit Daten zur Verarbeitung von Aufträgen, Aufgaben und versuchten Aufgaben. Hadoop protokolliert außerdem Protokolle seiner Daemons. Weitere Informationen zu den von Hadoop geschriebenen Protokollen finden Sie unter http://hadoop.apache. org/docs/stable/hadoop-project-dist/hadoop-common/ClusterSetup.html.

Protokolldateien auf dem Primärknoten anzeigen

Die folgende Tabelle listet einige der Protokolldateien auf, die auf dem Primärknoten zu finden sind.

Ort	Beschreibung
/emr/instance-controller/log/bootstrap-Aktionen	Protokolle, die bei der Verarbeitung von Bootstrap-Aktionen geschrieben werden.
/-state-pusher mnt/var/log/hadoop	Protokolle, die vom Hadoop-Status-Push-Prozess geschrieben werden.
/emr/instance-controller/log	Instance-Controller-Protokolle.
/emr/instance-state	instance-Statusprotokolle. Diese enthalten Informationen über die CPU, den Arbeitsspeicher und Garbage Collector-Threads des Knotens.
/emr/service-nanny	Protokolle, die vom Service-Nanny-Prozess geschrieben werden.
/mnt/var/log/`application`	Protokolle, die sich auf eine bestimmte Anwendung beziehen, wie z. B. Hadoop, Spark oder Hive.
/mnt/var/log/hadoop/steps/`N`	Schrittprotokolle, die Informationen über die Verarbeitung des Schritts enthalten. Der Wert von `N` gibt die von Amazon EMR zugewiesene stepId an. Beispiel: Ein Cluster verfügt über zwei Schritte: `s-1234ABCDEFGH` und `s-5678IJKLMNOP`. Der erste Schritt befindet sich in `/mnt/var/log/hadoop/steps/s-1234ABCDEFGH/` und der zweite in `/mnt/var/log/hadoop/steps/s-5678IJKLMNOP/`. Die von Amazon EMR geschriebenen Schrittprotokolle lauten wie folgt. controller – Informationen zur Verarbeitung des Schritts. Wenn Ihr Schritt beim Laden fehlschlägt, finden Sie den Stack-Trace in diesem Protokoll. syslog – Beschreibt die Ausführung von Hadoop-Jobs in diesem Schritt. stderr – Der Standardfehlerkanal von Hadoop bei der Verarbeitung des Schritts. stdout – Der Standardausgabekanal von Hadoop während der Verarbeitung des Schritts.

So zeigen Sie Protokolldateien auf dem Primärknoten mit dem AWS CLI an.

Verwenden Sie SSH für die Verbindung mit dem Primärknoten wie in Stellen Sie mithilfe von SSH eine Connect zum primären Knoten des Amazon EMR-Clusters her beschrieben.
Navigieren Sie zu dem Verzeichnis mit den Protokolldateiinformationen, die Sie anzeigen möchten. Die oben stehenden Tabelle gibt eine Liste der verfügbaren Protokolldateien mit dem entsprechenden Speicherort an. Das folgende Beispiel zeigt den Befehl für die Navigation zum Schrittprotokoll mit einer ID, s-1234ABCDEFGH.
```
cd /mnt/var/log/hadoop/steps/s-1234ABCDEFGH/
```
Verwenden Sie einen Datei-Viewer Ihrer Wahl, um die Protokolldatei anzuzeigen. Im folgenden Beispiel wird der Linux-Befehl less verwendet, um die Protokolldatei controller anzuzeigen.
```
less controller
```

In Amazon S3 archivierte Protokolldateien anzeigen

Standardmäßig archivieren mit der Konsole gestartete Amazon-EMR-Cluster Protokolldateien in Amazon S3 automatisch. Sie können einen eigenen Protokollpfad angeben, und zulassen, dass die Konsole automatisch einen Protokollpfad generiert. Für Cluster, die mit der CLI oder API gestartet wurden, müssen Sie die Archivierung des Amazon-S3-Protokolls manuell konfigurieren.

Wenn Amazon EMR für die Archivierung von Protokolldateien in Amazon S3 konfiguriert ist, speichert es die Dateien an dem von Ihnen angegebenen S3-Speicherort, im Ordner/cluster-id/, wo sich die Cluster-ID cluster-id befindet.

Die folgende Tabelle listet einige der Protokolldateien auf, die in Amazon S3 zu finden sind.

Ort	Beschreibung
//node/ `cluster-id`	Knotenprotokolle, einschließlich Bootstrap-Aktion, Instance-Status und Anwendungsprotokollen für den Knoten. Die Protokolle für jeden Knoten werden in einem Ordner gespeichert, der mit der ID der EC2 Instanz dieses Knotens beschriftet ist.
/`cluster-idinstance-id`/node//`application`	Die Protokolle, die von einzelnen Anwendungen oder Daemons, die einer Anwendung zugeordnet sind, erstellt wurden. Das Hive-Server-Protokoll befindet sich beispielsweise im Verzeichnis `cluster-id/node/instance-id/hive/hive-server.log`.
//Schritte//`cluster-idstep-id`	Schrittprotokolle, die Informationen über die Verarbeitung des Schritts enthalten. Der Wert von `step-id` gibt die von Amazon EMR zugewiesene Schritt-ID an. Beispiel: Ein Cluster verfügt über zwei Schritte: `s-1234ABCDEFGH` und `s-5678IJKLMNOP`. Der erste Schritt befindet sich in `/mnt/var/log/hadoop/steps/s-1234ABCDEFGH/` und der zweite in `/mnt/var/log/hadoop/steps/s-5678IJKLMNOP/`. Die von Amazon EMR geschriebenen Schrittprotokolle lauten wie folgt. controller – Informationen zur Verarbeitung des Schritts. Wenn Ihr Schritt beim Laden fehlschlägt, finden Sie den Stack-Trace in diesem Protokoll. syslog – Beschreibt die Ausführung von Hadoop-Jobs in diesem Schritt. stderr – Der Standardfehlerkanal von Hadoop bei der Verarbeitung des Schritts. stdout – Der Standardausgabekanal von Hadoop während der Verarbeitung des Schritts.
//container `cluster-id`	Anwendungscontainerprotokolle. Die Protokolle für jede YARN-Anwendung werden an diesen Speicherorten abgelegt.
//hadoop-mapreduce/ `cluster-id`	Die Protokolle, die Informationen über Konfigurationsdetails und den Jobverlauf von Jobs enthalten. MapReduce

So zeigen Sie Protokolldateien an, die mit der Amazon-S3-Konsole in Amazon S3 archiviert wurden

Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/.
Öffnen Sie den S3-Bucket, den Sie angegeben haben, als Sie den Cluster für die Archivierung von Protokolldateien in Amazon S3 konfiguriert haben.
Navigieren Sie zu der Protokolldatei, die die Informationen enthält, die angezeigt werden sollen. Die oben stehenden Tabelle gibt eine Liste der verfügbaren Protokolldateien mit dem entsprechenden Speicherort an.
Laden Sie das Protokolldateiobjekt herunter, um es anzuzeigen. Anweisungen finden Sie unter Objekt herunterladen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Sehen Sie sich einen Anwendungsverlauf auf hoher Ebene in Amazon EMR an

Cluster-Instances in Amazon anzeigen EC2