Säule der Zuverlässigkeit - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Säule der Zuverlässigkeit

Die Säule Zuverlässigkeit umfasst die Fähigkeit eines Workloads, seine vorgesehene Funktion korrekt und konsistent auszuführen, wenn dies erwartet wird. Dazu gehört auch die Fähigkeit, den Workload während seines gesamten Lebenszyklus zu bedienen und zu testen.

Die Konfiguration eines zuverlässigen Workloads beginnt mit vorab getroffenen Designentscheidungen für Software und Infrastruktur. Ihre Auswahl in puncto Architektur wirkt sich in allen Well-Architected-Säulen auf das Verhalten der Workload aus. Um Zuverlässigkeit zu erreichen, müssen Sie bestimmten Mustern folgen.

Die Säule Zuverlässigkeit konzentriert sich auf die folgenden Schlüsselbereiche:

  • Workload-Architektur, einschließlich Servicequotas und Bereitstellungsmustern

  • Verwaltung und Skalierung von InfluxDB-Instanzen

Workload-Architektur, einschließlich Servicequotas und Bereitstellungsmustern

In jedem AWS-Konto Fall gibt es Kontingente für Ressourcen, die in jedem angeboten werden AWS-Region. Beispielsweise hat jede Region ein Kontingent für Timestream für InfluxDB-Instances, unabhängig von der Instanzgröße. Nachdem Sie die maximale Anzahl von Instanzen in einer Region erreicht haben, schlagen zusätzliche Aufrufe zum Erstellen von Instances mit einer Ausnahme fehl. Ein Speichervolumen von Timestream for InfluxDB-Instances kann auf eine maximale Größe von 16 Tebibyte () TiBs anwachsen, sofern alle unterstützt werden. AWS-Regionen

Bereitstellungsmuster

Für Hochverfügbarkeit und Failover-Unterstützung für Timestream for InfluxDB-Instances können Sie Multi-AZ-Bereitstellungen mit einer einzigen Standby-DB-Instance verwenden. Diese Art der Bereitstellung wird als Multi-AZ-DB-Instance-Bereitstellung bezeichnet. Amazon Timestream for InfluxDB verwendet die Amazon-Failover-Technologie. In einer Multi-AZ-DB-Instance-Bereitstellung stellt Amazon Timestream automatisch ein synchrones Standby-Replikat in einer anderen Availability Zone bereit und verwaltet es. Um Datenredundanz zu gewährleisten, wird die primäre DB-Instance synchron über Availability Zones hinweg auf das Standby-Replikat repliziert.

Durch den Betrieb einer DB-Instance mit hoher Verfügbarkeit kann die Verfügbarkeit bei einem Ausfall der DB-Instance oder bei einer Unterbrechung der Availability Zone gewährleistet werden. Wenn ein ungeplanter Ausfall Ihrer DB-Instance auf einen Infrastrukturdefekt zurückzuführen ist, wechselt Amazon Timestream for InfluxDB automatisch zur Standby-Replik. Die Dauer, bis der Failover-Prozess abgeschlossen ist, hängt von der Datenbankaktivität sowie von anderen Bedingungen zu dem Zeitpunkt ab, an dem die primäre DB-Instance ausgefallen ist.

Der Failover-Prozess dauert normalerweise 60–120 Sekunden. Große Transaktionen mit Daten mit hoher Kardinalität oder ein langwieriger Wiederherstellungsprozess mit Anforderungen vor dem Aufwärmen können jedoch die Failover-Zeit verlängern. Nach Abschluss des Failovers kann zusätzliche Zeit erforderlich sein, bis die Timestream-Konsole die neue Availability Zone wiedergibt.

Wenn Ihre Anwendung während eines vollständigen AWS-Region Ausfalls verfügbar bleiben muss, sollten Sie im Rahmen Ihrer Disaster Recovery (DR) -Pläne die Replikation einrichten oder in eine andere Region schreiben. Bevor Sie die Replikation einrichten, sollten Sie jedoch sicherstellen, dass Sie die Einschränkungen kennen. Weitere Informationen finden Sie in der InfluxDB-Dokumentation.

Amazon Timestream for InfluxDB erstellt regelmäßig interne Backups und bewahrt sie 24 Stunden lang auf, um Verfügbarkeit und Haltbarkeit zu gewährleisten. Snapshots werden bei Löschungen erstellt und zur Unterstützung von Wiederherstellungen 30 Tage lang aufbewahrt. Um auf diese zuzugreifen oder sie zu verwenden, erstellen Sie einen Fall unter. AWS -Support

Timestream für InfluxDB verwalten und skalieren

Timestream for InfluxDB unterstützt Instanzklassen, die sich ideal für die Ausführung speicherintensiver Workloads in Open-Source-InfluxDB-Datenbanken eignen. Die verschiedenen db.influx-Instanzklassen haben Beschränkungen für V, Arbeitsspeicher, Speicher und Netzwerkbandbreite. CPUs Um die Instance-Klasse auszuwählen, die den Schreib- und Abfragelatenzanforderungen Ihrer Anwendung entspricht, beachten Sie beim Testen die Amazon- CloudWatch CPUUtilizationMemoryUtilization, und DiskUtilization -Metriken. Sie können Ihre Instances je nach Ihren Workload-Anforderungen nach oben oder unten skalieren. Timestream for InfluxDB bietet mehrere Speicherstufen, die mit optimalen IOPS und Durchsätzen vorkonfiguriert sind, die für verschiedene Arten von Workloads erforderlich sind. Wählen Sie anhand Ihrer Anforderungen aus, was für Ihren Workload am besten geeignet ist.

Wenn sich Ihre Skalierungsanforderungen zu vorhersehbaren Zeiten ändern, können Sie eine AWS Lambda Funktion oder einen benutzerdefinierten Scheduler verwenden und eine API oder ein SDK ausführen, um mit einer gewissen Pufferzeit nach oben oder unten zu skalieren.

Sie verwalten Ihre InfluxDB-Konfiguration in Timestream for InfluxDB, indem Sie Parameter in einer Parametergruppe verwenden. Parametergruppen dienen als Container für InfluxDB-Konfigurationsoptionen, die auf eine oder mehrere DB-Instances angewendet werden. Wenn Sie Parameter in Parametergruppen ändern, sollten Sie den Unterschied zwischen statischen und dynamischen Parametern verstehen und wissen, wie und wann sie angewendet werden. Verwenden Sie die GetDbParameterGroupAPI-Aktion, um die aktuell angewendete Konfiguration zu sehen.