Testen der Notfallwiederherstellung - Notfallwiederherstellung von Workloads auf AWS: Wiederherstellung in der Cloud

Testen der Notfallwiederherstellung

Testen Sie die Implementierung der Notfallwiederherstellung, um die Implementierung zu validieren. Testen Sie regelmäßig den Failover zur DR-Region Ihres Workloads, um sicherzustellen, dass RTO und RPO eingehalten werden.

Ein Modell zur Vermeidung ist die Entwicklung von Wiederherstellungspfaden, die selten ausgeführt werden. So könnten Sie beispielsweise einen zweiten Datenspeicher unterhalten, der nur für Leseabfragen verwendet wird. Wenn Sie Daten in einen Datenspeicher schreiben und der primäre Datenspeicher einen Fehler ausgibt, können Sie einen Failover auf den zweiten Datenspeicher durchführen. Wenn Sie diesen Failover nicht regelmäßig testen, werden Sie möglicherweise feststellen, dass Ihre Annahmen zu den Möglichkeiten des sekundären Datenspeichers unzutreffend sind. Die Kapazität der sekundären Region, die beim letzten Test vielleicht noch ausreichend war, kann die Last in diesem Szenario möglicherweise nicht mehr bewältigen, oder die Service-Kontingente in der sekundären Region reichen nicht aus.

Unsere Erfahrungen haben gezeigt, dass bei einer Wiederherstellung nach einem Fehler nur der Pfad funktioniert, den Sie regelmäßig testen. Aus diesem Grund ist es am besten, eine kleine Anzahl von Wiederherstellungspfaden zu nutzen.

Sie können Wiederherstellungsmuster erstellen und diese regelmäßig testen. Wenn Sie einen komplexen oder kritischen Wiederherstellungspfad nutzen, müssen Sie diesen Ausfall dennoch regelmäßig in der Produktion testen, um zu überprüfen, ob der Wiederherstellungspfad funktioniert.

Verwalten Sie die Konfigurationsabweichung in der DR-Region. Stellen Sie sicher, dass Ihre Infrastruktur, Daten und Konfiguration in der DR-Region den Anforderungen entsprechen. Prüfen Sie zum Beispiel, ob AMIs und Service-Kontingente auf dem neuesten Stand sind.

Sie können AWS Config verwenden, um Ihre AWS-Ressourcenkonfigurationen kontinuierlich zu überwachen und aufzuzeichnen. AWS Config kann eine Abweichung erkennen und AWS Systems Manager Automation zur Behebung von Abweichungen und für Alarme nutzen. AWS CloudFormation kann zusätzlich Abweichungen in bereitgestellten Stacks erkennen.