Testen von Amazon Aurora My SQL mithilfe von Fault Injection-Abfragen - Amazon Aurora

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Testen von Amazon Aurora My SQL mithilfe von Fault Injection-Abfragen

Sie können die Fehlertoleranz Ihres Aurora My SQL DB-Clusters mithilfe von Fault-Injection-Abfragen testen. Fault-Injection-Abfragen werden als SQL Befehle an eine Amazon Aurora Aurora-Instance ausgegeben. Sie ermöglichen Ihnen, eines der folgenden Fehlerereignisse geplant zu simulieren:

  • Einen Ausfall einer Writer- oder Reader-DB-Instance

  • Ein Ausfall eines Aurora-Replikats

  • Einen Festplattenfehler

  • Festplattenüberlastung

Wenn eine Fault-Injection-Abfrage einen Absturz angibt, erzwingt sie einen Absturz der Aurora My SQL DB-Instance. Die anderen Fehler-Injection-Abfragen erzeugen Simulationen von Ausfallereignissen, lösen aber keine Ereignisse aus. Wenn Sie eine Fehlersimulationsabfrage senden, geben Sie auch einen Zeitraum vor, in dem die Simulation ablaufen soll.

Sie können eine Fehlersimulationsabfrage an eine Ihrer Aurora Replica-Instances senden, indem Sie eine Verbindung mit dem Endpunkt der Aurora Replica herstellen. Weitere Informationen finden Sie unter Amazon Aurora Aurora-Endpunktverbindungen.

Zum Ausführen von Fehlersimulationsabfragen sind alle Master-Benutzerrechte erforderlich. Weitere Informationen finden Sie unter Berechtigungen von Hauptbenutzerkonten.

Testen eines Instance-Ausfalls

Sie können den Absturz einer Amazon-Aurora-Instance erzwingen, indem Sie die Fehlersimulationsabfrage ALTER SYSTEM CRASH verwenden.

Für diese Fehlersimulationsabfrage tritt kein Failover auf. Wenn Sie einen Failover testen möchten, können Sie die Failover-Instance-Aktion für Ihren DB-Cluster in der RDS Konsole auswählen oder den failover-db-cluster AWS CLI Befehl oder die ailoverDBClusterRDSAPIF-Operation verwenden.

Syntax

ALTER SYSTEM CRASH [ INSTANCE | DISPATCHER | NODE ];

Optionen

Diese Fehlersimulationsabfrage löst einen der folgenden Ausfalltypen aus:

  • INSTANCE— Ein Absturz der My SQL -kompatiblen Datenbank für die Amazon Aurora Aurora-Instance wird simuliert.

  • DISPATCHER – Es wird ein Absturz des Dispatchers auf Schreiber-Instance für das Aurora-DB-Cluster simuliert. Der Dispatcher schreibt Updates zum Cluster-Volume für ein Amazon Aurora-DB-Cluster.

  • NODE— Ein Absturz sowohl der My SQL -kompatiblen Datenbank als auch des Dispatchers für die Amazon Aurora Aurora-Instance wird simuliert. Für diese Fehlersimulationsabfrage wird auch der Cache gelöscht.

Der Standard-Ausfalltyp ist INSTANCE.

Testen eines Aurora-Replikatausfalls

Sie können den Ausfall eines Aurora-Replikats mittels der Fehlersimulationsabfrage ALTER SYSTEM SIMULATE READ REPLICA FAILURE simulieren.

Der Ausfall eines Aurora Replica blockiert alle Anfragen an einen Aurora Replica oder alle Aurora Replicas im DB-Cluster für einen bestimmten Zeitabschnitt. Wenn das Zeitintervall abgelaufen ist, werden die betroffenen Aurora Replicas automatisch mit der Writer-Instance synchronisiert.

Syntax

ALTER SYSTEM SIMULATE percentage_of_failure PERCENT READ REPLICA FAILURE [ TO ALL | TO "replica name" ] FOR INTERVAL quantity { YEAR | QUARTER | MONTH | WEEK | DAY | HOUR | MINUTE | SECOND };

Optionen

Diese Fehlersimulationsabfrage verwendet die folgenden Parameter:

  • percentage_of_failure – Der Prozentsatz der Anfragen, die während des Ausfallereignisses blockiert werden sollen. Dieser Wert kann ein Duplikat zwischen 0 und 100 sein. Wenn Sie 0 festlegen, werden keine Anfragen blockiert. Wenn 100 festgelegt wird, werden alle Anfragen blockiert.

  • Ausfalltyp – Der zu simulierende Ausfalltyp. Legen Sie TO ALL fest, um Ausfälle für alle Aurora-Replikate im DB-Cluster zu simulieren. Geben Sie TO und den Namen eines Aurora-Replikats an, um einen Ausfall des einzelnen Aurora-Replikats zu simulieren. Der Standard-Ausfalltyp ist TO ALL.

  • quantity – Der Zeitraum, über den der Ausfall des Aurora-Replikats simuliert werden soll. Das Intervall wird als eine Menge gefolgt von einer Zeiteinheit angegeben. Die Simulation wird für die Dauer der angegebenen Einheit auftreten. Beispielsweise ergibt 20 MINUTE eine Simulation, die 20 Minuten lang ausgeführt wird.

    Anmerkung

    Seien Sie vorsichtig bei der Angabe des Zeitintervalls für das Ausfallereignis in Ihrem Aurora-Replikat. Wenn Sie ein zu langes Zeitintervall festlegen und Ihre Schreiber-Instance eine große Datenmenge während des Ausfallereignisses schreibt, könnte Ihr Aurora-DB-Cluster annehmen, dass Ihr Aurora-Replikat ausgefallen ist und es ersetzen.

Testen eines Festplattenausfalls

Sie können einen Datenträgerausfall für ein Aurora-DB-Cluster mittels der Fehlersimulationsabfrage ALTER SYSTEM SIMULATE DISK FAILURE simulieren.

Während einer Simulation eines Festplattenausfalls markiert der Aurora-DB-Cluster zufällige Festplattensegmente als fehlerhaft. Anfragen an diese Segmente werden für die Dauer der Simulation blockiert.

Syntax

ALTER SYSTEM SIMULATE percentage_of_failure PERCENT DISK FAILURE [ IN DISK index | NODE index ] FOR INTERVAL quantity { YEAR | QUARTER | MONTH | WEEK | DAY | HOUR | MINUTE | SECOND };

Optionen

Diese Fehlersimulationsabfrage verwendet die folgenden Parameter:

  • percentage_of_failure – Der Prozentsatz des Datenträgers, der während des Ausfallereignisses als ausgefallen markiert werden soll. Dieser Wert kann ein Duplikat zwischen 0 und 100 sein. Wenn Sie 0 festlegen, wird kein Segment der Festplatte als fehlerhaft markiert. Wenn Sie 100 festlegen, wird die gesamte Festplatte als fehlerhaft markiert.

  • DISK index – Ein spezifischer logischer Datenblock, für den das Ausfallereignis simuliert werden soll. Wenn Sie den verfügbaren Bereich an logischen Datenblocks überschreiten, erhalten Sie eine Fehlermeldung, in der Ihnen der maximal festlegbare Indexwert mitgeteilt wird. Weitere Informationen finden Sie unter Anzeigen des Volume-Status für einen Aurora MySQL-DB-Cluster.

  • NODE index – Ein spezifischer Speicherknoten, für den das Ausfallereignis simuliert werden soll. Wenn Sie den verfügbaren Bereich an Speicherknoten überschreiten, erhalten Sie eine Fehlermeldung, in der Ihnen der maximal festlegbare Indexwert mitgeteilt wird. Weitere Informationen finden Sie unter Anzeigen des Volume-Status für einen Aurora MySQL-DB-Cluster.

  • quantity – Der Zeitraum, über den der Datenträgerausfall simuliert werden soll. Das Intervall wird als eine Menge gefolgt von einer Zeiteinheit angegeben. Die Simulation wird für die Dauer der angegebenen Einheit auftreten. Beispielsweise ergibt 20 MINUTE eine Simulation, die 20 Minuten lang ausgeführt wird.

Testen einer Festplattenüberlastung

Sie können einen Datenträgerausfall für ein Aurora-DB-Cluster mittels der Fehlersimulationsabfrage ALTER SYSTEM SIMULATE DISK CONGESTION simulieren.

Während einer Simulation einer Festplattenüberlastung markiert der Aurora-DB-Cluster zufällige Festplattensegmente als überlastet. Anfragen an diese Segmente werden für die Dauer der angegebenen minimalen und maximalen Verzögerungszeit während der Simulation verzögert.

Syntax

ALTER SYSTEM SIMULATE percentage_of_failure PERCENT DISK CONGESTION BETWEEN minimum AND maximum MILLISECONDS [ IN DISK index | NODE index ] FOR INTERVAL quantity { YEAR | QUARTER | MONTH | WEEK | DAY | HOUR | MINUTE | SECOND };

Optionen

Diese Fehlersimulationsabfrage verwendet die folgenden Parameter:

  • percentage_of_failure – Der Prozentsatz des Datenträgers, der während des Ausfallereignisses als überlastet markiert werden soll. Dieser Wert kann ein Duplikat zwischen 0 und 100 sein. Wenn Sie 0 festlegen, wird kein Segment der Festplatte als überlastet markiert. Wenn Sie 100 festlegen, wird die gesamte Festplatte als überlastet markiert.

  • DISK index oder NODE index – Ein spezifischer Datenträger oder Knoten, für den das Ausfallereignis simuliert werden soll. Wenn Sie den verfügbaren Bereich der Indizes für die Festplatten oder den Knoten überschreiten, erhalten Sie eine Fehlermeldung, in der Ihnen der maximal festlegbare Indexwert mitgeteilt wird.

  • minimum und maximum – Der Mindest- und Höchstwert in Millisekunden für die Überlastungsverzögerung. Festplattensegmente, die als überlastet markiert sind, werden innerhalb des Bereichs zwischen der minimalen und maximalen Anzahl an Millisekunden während der Simulation verzögert.

  • quantity – Der Zeitraum, über den die Datenträgerüberlastung simuliert werden soll. Das Intervall wird als eine Menge gefolgt von einer Zeiteinheit angegeben. Die Simulation wird für die Dauer der angegebenen Zeiteinheit ausgeführt. Beispielsweise ergibt 20 MINUTE eine Simulation, die 20 Minuten lang ausgeführt wird.