Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Ersetzen fehlerhafter Knoten durch Amazon EMR
Amazon EMR verwendet regelmäßig den NodeManager Health Checker-Service
Anmerkung
Ein häufiger Grund dafür, dass ein Knoten fehlerhaft ist, ist, dass ihm nicht genügend Speicherplatz zur Verfügung steht. Für weitere Informationen darüber, wann ein Core-Knoten fast keinen Speicherplatz mehr hat, ist der folgende re:POST Knowledge Center-Artikel hilfreich: Warum geht dem Kernknoten in meinem Amazon EMR-Cluster der Speicherplatz aus
Anmerkung
Hadoop bietet die Möglichkeit, benutzerdefinierte Node-Integritätsprüfungen durchzuführen. Dies wird in der Apache Hadoop-Dokumentation unter ausführlicher erklärt. NodeManager
Sie können wählen, ob Amazon EMR fehlerhafte Knoten beenden oder sie im Cluster belassen soll. Wenn Sie den Austausch fehlerhafter Knoten deaktivieren, bleiben diese auf der Sperrliste und werden weiterhin auf die Clusterkapazität angerechnet. Sie können zur Konfiguration und Wiederherstellung weiterhin eine Verbindung zu Ihrer Amazon EC2 Core-Instance herstellen, sodass Sie die Größe Ihres Clusters ändern können, wenn Sie Kapazität hinzufügen möchten. Weitere Informationen darüber, wie der Austausch und die Kündigung von Knoten funktionieren, finden Sie unter Terminierungsschutz verwenden.
Wenn der Austausch fehlerhafter Knoten aktiviert ist, beendet Amazon EMR einen fehlerhaften Core-Knoten und stellt eine neue Instance bereit, basierend auf der Anzahl der Instances in der Instance-Gruppe oder basierend auf der Zielkapazität für Instance-Flotten. Wenn Knoten länger als 45 Minuten fehlerhaft sind, ersetzt Amazon EMR die Knoten ordnungsgemäß. Wenn die ordnungsgemäße Außerbetriebnahme eines Knotens nicht innerhalb einer Stunde abgeschlossen ist, wird der Knoten gewaltsam beendet, es sei denn, durch seine Beendigung wird der Cluster unter den Replikationsfaktor oder die HDFS-Kapazitätsbeschränkungen gebracht.
Wichtig
Beachten Sie, dass sich die Zeit, die benötigt wird, bis ein Knoten ordnungsgemäß außer Betrieb genommen oder beendet wird, ändern kann.
Durch den Austausch fehlerhafter Knoten wird zwar die Wahrscheinlichkeit eines Datenverlusts erheblich verringert, das Risiko wird jedoch nicht vollständig ausgeschlossen. HDFS-Daten können beim ordnungsgemäßen Austausch einer fehlerhaften Core-Instance dauerhaft verloren gehen. Wir empfehlen, dass Sie Ihre Daten immer sichern.
Weitere Informationen zur Identifizierung fehlerhafter Knoten und zur Wiederherstellung finden Sie unter Ressourcenfehler. Weitere bewährte Methoden, die Sie befolgen können, um die Integrität eines Clusters aufrechtzuerhalten, finden Sie in der folgenden Dokumentation zum Ressourcenfehler Amazon EMR-Cluster terminates with NO_SLAVE_LEFT und Core Nodes FAILED_BY_MASTER.
Amazon EMR veröffentlicht Amazon CloudWatch Events für den Austausch fehlerhafter Knoten, sodass Sie verfolgen können, was mit Ihren fehlerhaften Core-Instances passiert. Weitere Informationen finden Sie unter Ereignisse beim Austausch fehlerhafter Knoten.
Standardeinstellungen für den Austausch von Knoten und den Kündigungsschutz
Unhealthy Node Replacement ist für alle Amazon EMR-Versionen verfügbar, aber die Standardeinstellungen hängen von der von Ihnen gewählten Release-Bezeichnung ab. Sie können jede dieser Einstellungen ändern, indem Sie beim Erstellen eines neuen Clusters den Austausch fehlerhafter Knoten konfigurieren oder indem Sie jederzeit zur Cluster-Konfiguration wechseln.
Wenn Sie einen Einzelknoten-Cluster oder einen Hochverfügbarkeitscluster erstellen, auf dem Amazon EMR Version 7.0 oder niedriger ausgeführt wird, hängt die Standardeinstellung für den Austausch fehlerhafter Knoten vom Kündigungsschutz ab:
Durch die Aktivierung des Kündigungsschutzes wird der Austausch fehlerhafter Knoten deaktiviert.
Durch die Deaktivierung des Terminierungsschutzes wird der Austausch fehlerhafter Knoten ermöglicht.
Konfiguration des Austauschs fehlerhafter Knoten beim Start eines Clusters
Sie können den Austausch fehlerhafter Knoten aktivieren oder deaktivieren, wenn Sie einen Cluster über die Konsole AWS CLI, die oder die API starten.
Die Standardeinstellung für den Austausch fehlerhafter Knoten hängt davon ab, wie Sie den Cluster starten:
-
Amazon EMR-Konsole — Der Austausch fehlerhafter Knoten ist standardmäßig aktiviert.
-
AWS CLI
aws emr create-cluster
— Der Austausch fehlerhafter Knoten ist standardmäßig aktiviert, sofern Sie nichts anderes angeben.--no-unhealthy-node-replacement
-
Der Amazon RunJobFlow EMR-API-Befehl — Austausch ungesunder Knoten ist standardmäßig aktiviert, sofern Sie den
UnhealthyNodeReplacement
booleschen Wert nicht auf oder setzen.True
False
Konfiguration eines fehlerhaften Knotenaustauschs in einem laufenden Cluster
Sie können den Austausch fehlerhafter Knoten für einen laufenden Cluster mithilfe der Konsole, der oder der API ein AWS CLI- oder ausschalten.