Verfügbarkeit und mehr: Die Resilienz verteilter Systeme verstehen und verbessern AWS - Verfügbarkeit und mehr: Verständnis und Verbesserung der Widerstandsfähigkeit verteilter Systeme auf AWS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verfügbarkeit und mehr: Die Resilienz verteilter Systeme verstehen und verbessern AWS

Datum der Veröffentlichung: 12. November 2021 (Dokumentverlauf)

Heute betreiben Unternehmen komplexe, verteilte Systeme sowohl in der Cloud als auch vor Ort. Sie möchten, dass diese Workloads widerstandsfähig sind, um ihre Kunden zu bedienen und ihre Geschäftsergebnisse zu erzielen. In diesem Whitepaper wird ein allgemeines Verständnis von Verfügbarkeit als Maß für Resilienz dargelegt, Regeln für den Aufbau hochverfügbarer Workloads festgelegt und Anleitungen zur Verbesserung der Workload-Verfügbarkeit gegeben.

Einführung

Was bedeutet es, einen hochverfügbaren Workload aufzubauen? Wie misst man die Verfügbarkeit? Was kann ich tun, um die Verfügbarkeit meines Workloads zu erhöhen? Dieses Dokument hilft Ihnen bei der Beantwortung solcher Fragen. Es ist in drei Hauptabschnitte unterteilt. Der erste Abschnitt, Verfügbarkeit verstehen, ist größtenteils theoretisch. Es schafft ein gemeinsames Verständnis der Definition von Verfügbarkeit und der Faktoren, die sich darauf auswirken. Der zweite Abschnitt, Messung der Verfügbarkeit, enthält Anleitungen zur empirischen Messung der Verfügbarkeit Ihres Workloads. Der dritte Abschnitt, Entwurf hochverfügbarer verteilter Systeme auf, AWS ist eine praktische Anwendung der im ersten Abschnitt vorgestellten Ideen. Darüber hinaus werden in diesem Dokument in diesen Abschnitten Regeln für den Aufbau stabiler Workloads aufgeführt. Dieses Dokument soll die Leitlinien und bewährten Verfahren unterstützen, die in der Säule „AWSWell-Architected Reliability“ vorgestellt werden.

In diesem Artikel werden Sie auf viel algebraische Mathematik stoßen. Die wichtigsten Erkenntnisse sind die Konzepte, die diese Mathematik unterstützt, nicht die Mathematik selbst. Nichtsdestotrotz ist es auch die Absicht dieses Papiers, eine Herausforderung darzustellen. Wenn Sie hochverfügbare Workloads betreiben, müssen Sie in der Lage sein, mathematisch nachzuweisen, dass das, was Sie erstellt haben, das erreicht, was Sie beabsichtigt haben. Selbst die besten Designs, die auf guten Absichten basieren, erzielen möglicherweise nicht immer das gewünschte Ergebnis. Das bedeutet, dass Sie Mechanismen benötigen, die die Effektivität der Lösung messen. Daher ist ein gewisses Maß an Mathematik erforderlich, um belastbare, hochverfügbare verteilte Systeme aufzubauen und zu betreiben.