Amazon EMR-Clusterfehler: Datei konnte nur auf 0 statt auf 1 Knoten repliziert werden

Wenn eine Datei in HDFS geschrieben wird, wird sie in mehreren Core-Knoten repliziert. Wenn Sie diesen Fehler sehen, bedeutet dies, dass der NameNode Daemon keine verfügbaren DataNode Instanzen hat, in die Daten in HDFS geschrieben werden können. Mit anderen Worten, es findet keine Block-Replikation statt. Dieser Fehler kann durch eine Reihe von Problemen verursacht werden:

Das HDFS-Dateisystem hat keinen verfügbaren Speicherplatz. Dies ist die wahrscheinlichste Ursache.
DataNode Instanzen waren möglicherweise nicht verfügbar, als der Job ausgeführt wurde.
DataNode Instanzen wurden möglicherweise für die Kommunikation mit dem Master-Knoten gesperrt.
Instances in der Core-Instance-Gruppe sind möglicherweise nicht verfügbar.
Berechtigungen können fehlen. Beispielsweise ist der JobTracker Daemon möglicherweise nicht berechtigt, Job-Tracker-Informationen zu erstellen.
Die Einstellung für den reservierten Speicherplatz für eine DataNode Instanz ist möglicherweise unzureichend. Stellen Sie fest, ob dies der Fall ist, indem Sie die Konfigurationseinstellung dfs.datanode.du.reserved prüfen.

Um zu überprüfen, ob dieses Problem dadurch verursacht wird, dass HDFS nicht mehr genügend Festplattenspeicher hat, sehen Sie sich die HDFSUtilization Metrik unter an. CloudWatch Wenn dieser Wert zu hoch ist, können Sie zusätzliche Core-Knoten zum Cluster hinzufügen. Wenn Sie einen Cluster haben, von dem Sie glauben, dass der HDFS-Festplattenspeicher knapp wird, können Sie einen Alarm einrichten, der Sie warnt, wenn der Wert von HDFSUtilization einen bestimmten Wert überschreitet. CloudWatch Weitere Informationen erhalten Sie unter Manuelles Ändern der Größe eines laufenden Amazon EMR-Clusters und Überwachung von Amazon EMR-Metriken mit CloudWatch.

Falls HDFS nicht zu wenig Speicherplatz zur Verfügung gestellt hat, überprüfen Sie die DataNode Protokolle, NameNode Protokolle und Netzwerkverbindungen auf andere Probleme, die HDFS daran gehindert haben könnten, Daten zu replizieren. Weitere Informationen finden Sie unter Amazon EMR-Protokolldateien anzeigen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Amazon EMR-Clusterfehler: Zu viele Abruffehler

Amazon EMR-Clusterfehler: Knoten auf der Deni-List-Liste