Wiederherstellen der Instance - Amazon Elastic Compute Cloud

Wiederherstellen der Instance

Sie können einen Amazon CloudWatch-Alarm erstellen, der eine Amazon EC2-Instance überwacht und die Instance automatisch wiederherstellt, wenn diese aufgrund eines zugrunde liegenden Hardware-Ausfalls oder eines Problems, das eine Beteiligung von AWS für eine Reparatur erforderlich macht, beeinträchtigt wird. Beendete Instances können nicht wiederhergestellt werden.

Eine wiederhergestellte Instance ist mit der ursprünglichen Instance identisch. Dies schließt auch die Instance-ID, private IP-Adressen, Elastic IP-Adressen und alle Instance-Metadaten mit ein. Wenn die beeinträchtigte Instance über eine öffentliche IPv4-Adresse verfügt, behält die Instance diese nach der Wiederherstellung bei. Wenn sich die beeinträchtigte Instance in einer Platzierungsgruppe befindet, wird die wiederhergestellte Instance in der Platzierungsgruppe ausgeführt.

Wird der Alarm StatusCheckFailed_System ausgelöst und die Aktion zur Wiederherstellung initiiert, werden Sie durch das Amazon SNS-Thema, das Sie bei der Erstellung des Alarms gewählt haben und das mit der Aktion zur Wiederherstellung verknüpft ist, darüber benachrichtigt. Während der Instance-Wiederherstellung wird die Instance bei einem Instance-Neustart migriert und alle im Speicher befindlichen Daten gehen verloren. Wenn der Vorgang abgeschlossen ist, wird die Information in dem SNS-Thema, das Sie für den Alarm konfiguriert haben, veröffentlicht. Alle Personen, die das SNS-Thema abonniert haben, erhalten eine Benachrichtigung per E-Mail, in der auch der Status des Wiederherstellungsversuchs und weitere Anweisungen enthalten sind. Sie werden bemerken, dass auf der wiederhergestellten Instance ein Instance-Neustart durchgeführt wird.

Beispiele für Probleme, die dazu führen, dass Systemstatusprüfungen fehlschlagen, sind:

  • Verlust der Netzwerkverbindung

  • Systemstromausfall

  • Softwareprobleme auf dem physischen Host

  • Hardwareprobleme auf dem physischen Host, die die Erreichbarkeit des Netzwerks beeinträchtigen

Requirements

Die Wiederherstellungsaktion wird nur auf Instances mit den folgenden Merkmalen unterstützt:

  • Verwenden Sie einen der folgenden Instance-Typen: A1, C3, C4, C5, C5a, C5n, C6g, C6gn, Inf1, M3, M4, M5, M5a, M5n, M5zn, M6g, P3, P4, R3, R4, R5, R5a, R5b, R5n, R6g, T2, T3, T3a, T4g, großer Speicher (nur virtualisiert), X1, X1e

  • Wird in einer Virtual Private Cloud (VPC) ausgeführt

  • Verwendet default- oder dedicated-Instance-Tenancy

  • Hat nur EBS-Volumes (konfigurieren Sie keine Instance-Speicher-Volumes)

Erstellen eines Amazon CloudWatch-Alarms, um eine Instance wiederherzustellen

Informationen zum Erstellen eines Amazon CloudWatch-Alarms zum Wiederherstellen einer Instance finden Sie unter Hinzufügen von Aktionen zum Wiederherstellen zu Amazon CloudWatch-Alarmen.

Beheben von Problemen bei fehlgeschlagener Instance-Wiederherstellung

Die folgenden Probleme können dazu führen, dass die automatische Wiederherstellung Ihrer Instance fehlschlägt:

  • Es steht vorübergehend keine ausreichende Kapazität der Ersatz-Hardware zur Verfügung.

  • Die Instance verfügt über einen angefügten Instance-Speicher, der eine nicht unterstützte Konfiguration für die automatische Instance-Wiederherstellung darstellt.

  • Es wird ein Ereignis der Übersicht zum Servicestatus ausgeführt, das eine erfolgreiche Ausführung des Wiederherstellungsprozesses verhindert. Lesen Sie dazu http://status.aws.amazon.com/, um die neuesten Informationen zur Serviceverfügbarkeit zu erhalten.

  • Die Instance hat die maximal zulässige Anzahl von Wiederherstellungsversuchen pro Tag erreicht.

Der automatische Wiederherstellungsprozess versucht, Ihre Instance bis zu drei Mal pro Tag wiederherzustellen. Wenn die Systemstatusprüfung der Instance weiterhin fehlschlägt, sollten Sie die Instance manuell anhalten und starten. Weitere Informationen finden Sie unter Anhalten und Starten Ihrer Instance.

Ihre Instance kann anschließend stillgelegt werden, wenn die automatische Wiederherstellung fehlschlägt und als Ursache für das Nichtbestehen der ursprünglichen Systemstatusprüfung ein Leistungsabfall der Hardware ermittelt wurde.