Statuschecks für EC2 Amazon-Instances - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Statuschecks für EC2 Amazon-Instances

Mit der Instance-Statusüberwachung können Sie schnell feststellen, ob Amazon Probleme erkannt EC2 hat, die Ihre Instances daran hindern könnten, Anwendungen auszuführen. Amazon EC2 führt automatische Prüfungen für jede laufende EC2 Instance durch, um Hardware- und Softwareprobleme zu identifizieren. Sie können die Ergebnisse dieser Statusprüfungen anzeigen, um bestimmte bzw. erkennbare Probleme zu ermitteln. Die Daten zum Ereignisstatus ergänzen die Informationen, die Amazon EC2 bereits über den Status der einzelnen Instances (wiepending,running,stopping) und die von Amazon CloudWatch überwachten Nutzungsmetriken (CPUAuslastung, Netzwerkverkehr und Festplattenaktivität) bereitstellt.

Statusprüfungen werden minütlich durchgeführt und geben als Status "Bestanden" oder "Fehler" zurück. Wenn alle Überprüfungen bestanden wurden, lautet der Gesamtstatus der Instance OK. Falls mindestens eine Überprüfung nicht bestanden wird, lautet der Gesamtstatus impaired (beeinträchtigt). Statusprüfungen sind in Amazon integriertEC2, sodass sie nicht deaktiviert oder gelöscht werden können.

Wenn eine Statusüberprüfung fehlschlägt, wird die entsprechende CloudWatch Metrik für Statusprüfungen inkrementiert. Weitere Informationen finden Sie unter Statusprüfungsmetriken. Sie können diese Metriken verwenden, um CloudWatch Alarme zu erstellen, die auf der Grundlage des Ergebnisses der Statusprüfungen ausgelöst werden. Beispielsweise können Sie einen Alarm erstellen, mit dem Sie gewarnt werden, wenn Statusprüfungen für eine bestimmte Instance fehlschlagen. Weitere Informationen finden Sie unter CloudWatch Alarme für EC2 Amazon-Instances erstellen, die Statusprüfungen nicht bestehen.

Sie können auch einen CloudWatch Amazon-Alarm erstellen, der eine EC2 Amazon-Instance überwacht und die Instance automatisch wiederherstellt, wenn sie aufgrund eines zugrunde liegenden Problems beeinträchtigt wird. Weitere Informationen finden Sie unter Resilienz von Instanzen.

Arten von Statusprüfungen

Es gibt drei Arten von Statusprüfungen.

System-Statusprüfungen

Systemstatusprüfungen überwachen die AWS Systeme, auf denen Ihre Instance läuft. Bei diesen Überprüfungen werden die zugrunde liegenden Probleme Ihrer Instance erkannt, für die zur Reparatur die Beteiligung von AWS erforderlich ist. Wenn eine Systemstatusprüfung fehlschlägt, können Sie wählen, ob Sie warten AWS möchten, bis das Problem behoben ist, oder Sie können es selbst lösen. Bei Instances, die von Amazon unterstützt werdenEBS, können Sie die Instance selbst beenden und starten, was in den meisten Fällen dazu führt, dass die Instance auf einen neuen Host migriert wird. Für Linux-Instances mit Unterstützung durch Instance-Speicher können Sie die Instance beenden und ersetzen. Für Windows-Instances muss es sich bei dem Root-Volume um ein EBS Amazon-Volume handeln. Der Instance-Speicher wird für das Root-Volume nicht unterstützt. Beachten Sie, dass Instance-Speicher-Volumes kurzlebig sind und alle Daten verloren gehen, wenn die Instance gestoppt wird.

Hier sind Beispiele für Probleme aufgeführt, die dazu führen können, dass System-Statusprüfungen fehlschlagen:

  • Verlust der Netzwerkverbindung

  • Systemstromausfall

  • Softwareprobleme auf dem physischen Host

  • Hardwareprobleme auf dem physischen Host, die die Erreichbarkeit des Netzwerks beeinträchtigen

Wenn eine Überprüfung des Systemstatus fehlschlägt, erhöhen wir die StatusCheckFailed_System-Metrik.

Bare Metal-Instances

Wenn Sie einen Neustart vom Betriebssystem auf einer Bare-Metal-Instance durchführen, gibt die Systemstatusprüfung möglicherweise vorübergehend einen Fehlerstatus zurück. Wenn die Instance verfügbar ist, sollte die Systemstatusprüfung einen Passstatus zurückgeben.

Instance-Statusprüfungen

Instance Status Checks (Instance-Statusprüfungen) Überwachen Sie die Software- und Netzwerkkonfiguration Ihrer individuellen Instance. Amazon EC2 überprüft den Zustand der Instance, indem es eine Anfrage zum Adressauflösungsprotokoll (ARP) an die Netzwerkschnittstelle (NIC) sendet. Bei diesen Überprüfungen werden Probleme Ihrer Instance erkannt, für die zur Reparatur Ihre Beteiligung erforderlich ist. Wenn eine Instance-Statusprüfung nicht bestanden wird, müssen Sie das Problem normalerweise selbst lösen (z. B. per Neustart der Instance oder durch das Vornehmen von Konfigurationsänderungen für die Instance).

Anmerkung

Neuere Linux-Distributionen, die systemd-networkd die Netzwerkkonfiguration verwenden, berichten möglicherweise anders über Integritätsprüfungen als frühere Distributionen. Während des Startvorgangs kann dieser Netzwerktyp früher gestartet und möglicherweise vor anderen Startaufgaben beendet werden, die sich ebenfalls auf den Zustand der Instance auswirken können. Statusprüfungen, die von der Netzwerkverfügbarkeit abhängen, können einen fehlerfreien Status melden, bevor andere Aufgaben abgeschlossen sind.

Hier sind Beispiele für Probleme aufgeführt, die dazu führen können, dass Instance-Statusprüfungen fehlschlagen:

  • Fehlgeschlagene System-Statusprüfungen

  • Fehlerhafte Netzwerk- oder Startup-Konfiguration

  • Unzureichender Speicher

  • Beschädigtes Dateisystem

  • Inkompatibler Kernel

  • [Windows-Instanzen] Während des Neustarts einer Instanz oder während der Bündelung einer durch den Windows-Instanzspeicher gestützten Instanz wird bei einer Instanzstatusprüfung ein Fehler gemeldet, bis die Instanz wieder verfügbar ist.

Wenn eine Überprüfung des Instanzstatus fehlschlägt, erhöhen wir die Metrik _Instance. StatusCheckFailed

Bare Metal-Instances

Wenn Sie einen Neustart des Betriebssystems auf einer Bare-Metal-Instance durchführen, gibt die Instance-Statusprüfung möglicherweise vorübergehend einen Fehlerstatus zurück. Wenn die Instance verfügbar wird, sollte die Instance-Statusprüfung einen Passstatus zurückgeben.

Angehängte Statusprüfungen EBS

EBSAngehängte Statusprüfungen überwachen, ob die an eine Instance angehängten EBS Amazon-Volumes erreichbar sind und I/O-Operationen abschließen können. Die StatusCheckFailed_AttachedEBS Metrik ist ein binärer Wert, der auf eine Beeinträchtigung hinweist, wenn eines oder mehrere der an die Instance angeschlossenen EBS Volumes I/O-Operationen nicht abschließen können. Diese Statusprüfungen erkennen grundlegende Probleme mit der Computer- oder EBS Amazon-Infrastruktur. Wenn die angehängte Metrik zur EBS Statusprüfung fehlschlägt, können Sie entweder warten, AWS bis das Problem behoben ist, oder Sie können Maßnahmen ergreifen, wie z. B. das Ersetzen der betroffenen Volumes oder das Stoppen und Neustarten der Instance.

Im Folgenden finden Sie Beispiele für Probleme, die dazu führen können, dass angehängte EBS Statusprüfungen fehlschlagen:

  • Hardware- oder Softwareprobleme in den Speichersubsystemen, die den EBS Volumes zugrunde liegen

  • Hardwareprobleme auf dem physischen Server, die sich auf die Erreichbarkeit der Volumes auswirken EBS

  • Verbindungsprobleme zwischen der Instance und den Volumes EBS

Sie können die StatusCheckFailed_AttachedEBS-Metrik verwenden, um die Stabilität Ihres Workloads zu verbessern. Sie können diese Metrik verwenden, um CloudWatch Amazon-Alarme zu erstellen, die auf der Grundlage des Ergebnisses der Statusprüfung ausgelöst werden. Sie könnten beispielsweise ein Failover auf eine sekundäre Instance oder Availability Zone durchführen, wenn Sie eine anhaltende Auswirkung feststellen. Alternativ können Sie die I/O-Leistung jedes angeschlossenen Volumes anhand von EBS CloudWatch Metriken überwachen, um das beschädigte Volume zu erkennen und zu ersetzen. Wenn Ihre Arbeitslast zu keinem der an Ihre Instance angeschlossenen EBS Volumes I/O führt und die EBS Statusprüfung des verbundenen Volumes auf eine Beeinträchtigung hinweist, können Sie die Instance beenden und starten, um Probleme mit dem physischen Host zu beheben, die sich auf die Erreichbarkeit der Volumes auswirken. EBS Weitere Informationen finden Sie unter CloudWatch Amazon-Metriken für Amazon EBS.

Sie können Ihre Amazon EC2 Auto Scaling Scaling-Gruppen auch so konfigurieren, dass sie Fehler bei der angehängten EBS Statusprüfung erkennen und dann die betroffene Instance durch eine neue ersetzen. Weitere Informationen finden Sie unter Überwachen und Ersetzen von Auto Scaling Scaling-Instances mit beeinträchtigten EBS Amazon-Volumes im Amazon EC2 Auto Scaling Scaling-Benutzerhandbuch.

Anmerkung

Die beigefügte Metrik zur EBS Statusprüfung ist nur für Nitro-Instances verfügbar.