Kapazitätsplanung - AWS Outposts Überlegungen zu Design und Architektur für hohe Verfügbarkeit

Dieses Dokument wird derzeit aktualisiert. In der Zwischenzeit sind einige Inhalte möglicherweise nicht korrekt.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Kapazitätsplanung

Während die EC2 Amazon-Kapazität in AWS-Regionen ist scheinbar unendlich, die Kapazität auf Outposts ist begrenzt — begrenzt durch das Gesamtvolumen der bestellten Rechenkapazität. Sie sind für die Planung und Verwaltung der Rechenkapazität Ihrer Outposts-Bereitstellungen verantwortlich. Sie sollten ausreichend Rechenkapazität bestellen, um ein N+M-Verfügbarkeitsmodell zu unterstützen, wobei N die erforderliche Anzahl von Servern und M die Anzahl der Reserveserver ist, die für Serverausfälle bereitgestellt werden. N+1 und N+2 sind die gängigsten Verfügbarkeitsstufen.

Jeder Server (C5, M5R5, usw.) unterstützt eine einzelne Instanzfamilie. EC2 Bevor Sie Instances auf EC2 Rechenservern starten können, müssen Sie Slot-Layouts bereitstellen, die die EC2Instanzgrößen angeben, die jeder Server bereitstellen soll. AWS konfiguriert jeden Server mit dem angeforderten Slotting-Layout.

Server können homogen eingesetzt werden, wobei alle Steckplätze dieselbe Instanzgröße haben (z. B. 48 m5.large Steckplätze), oder heterogene Steckplätze mit einer Mischung von Instanztypen (z. B. 4, 4m5.large, 3 m5.xlarge m5.2xlargem5.4xlarge, 1 und 1m5.8xlarge). Visualisierungen dieser Steckplatzkonfigurationen finden Sie in den nächsten drei Abbildungen.

Diagramm, das die Rechenressourcen des Servers zeigt m5.24xlarge

m5.24xlargeRechenressourcen des Servers

Das Diagramm zeigt, wie der m5.24xlarge Server homogen in 48 m5 große Steckplätze aufgeteilt ist

m5.24xlargeDer Server ist homogen in 48 Steckplätze aufgeteilt m5.large

Das Diagramm zeigt, wie der m5.24xlarge Server heterogen in 4m5.large, 4, 3 m5.xlargem5.2xlarge, 1 und 1 Steckplätze aufgeteilt ist m5.4xlarge m5.8xlarge

m5.24xlargeDer Server ist heterogen in 4m5.large, 4, 3 m5.xlargem5.2xlarge, 1 und 1 Steckplätze aufgeteilt m5.4xlarge m5.8xlarge

Die volle Serverkapazität muss nicht in Steckplätze gesteckt werden. Einem Server, der über nicht zugewiesene Kapazität verfügt, können Steckplätze hinzugefügt werden. Sie ändern ein Steckplatz-Layout, indem Sie ein Support-Ticket öffnen. Enterprise Support kann verlangen, dass Sie bestimmte Instances herunterfahren oder neu starten, um eine Resloting-Anfrage abzuschließen, falls das neue Slotting-Layout nicht angewendet werden kann, solange bestimmte Slots von laufenden Instances belegt sind.

Alle Server stellen ihre bereitgestellten Steckplätze den EC2 Kapazitätspools auf dem Outpost zur Verfügung, und alle Steckplätze eines bestimmten Instanztyps und einer bestimmten Größe werden als ein einziger Kapazitätspool verwaltet. EC2 Zum Beispiel würde der vorherige heterogene Server mit,m5.large, m5.xlarge m5.2xlargem5.4xlarge, und m5.8xlarge Steckplätzen diese Steckplätze zu fünf EC2 Kapazitätspools hinzufügen — einem Pool für jeden Instance-Typ und jede Instance-Größe.

Bei der Planung von Reservekapazitäten für die Verfügbarkeit von N+M-Servern ist es wichtig, Server-Steckplätze und EC2 Kapazitätspools zu berücksichtigen. AWS erkennt, wenn ein Server ausfällt oder heruntergefahren ist, und plant einen Besuch vor Ort, um den ausgefallenen Server zu ersetzen. Sie sollten Ihre EC2 Kapazitätspools so gestalten, dass sie den Ausfall von mindestens einem Server jeder Instanzfamilie (N+1) in einem Outpost tolerieren. Mit diesem Mindestmaß an Serververfügbarkeit können Sie, wenn ein Server ausfällt oder außer Betrieb genommen werden muss, ausgefallene oder heruntergestufte Instanzen auf den freien Steckplätzen der verbleibenden Server derselben Familie neu starten.

Die Planung der Verfügbarkeit von N+M ist einfach, wenn Sie über Server mit homogenen Steckplätzen oder Gruppen von Servern mit unterschiedlichen Steckplätzen und identischen Steckplatzlayouts verfügen. Sie berechnen einfach die Anzahl der Server (N), die Sie für die Ausführung all Ihrer Workloads benötigen, und fügen dann (M) zusätzliche Server hinzu, um Ihre Anforderungen an die Serververfügbarkeit bei Ausfall- und Wartungsereignissen zu erfüllen.

Die folgenden Steckplatzkonfigurationen können aufgrund von Grenzen nicht verwendet werden: NUMA

  • 3 m5.8xlarge

  • 1 m5.16xlarge und 1 m5.8xlarge

Konsultieren Sie Ihren AWS-Konto Team zur Validierung Ihres Plans AWS Outposts Konfiguration der Rack-Steckplätze.

In der folgenden Abbildung sind vier m5.24xlarge Server heterogen mit einem identischen Steckplatzlayout ausgestattet. Die vier Server bilden fünf Kapazitätspools. EC2 Jeder Pool wird mit maximaler Auslastung (75%) ausgeführt, um die Verfügbarkeit von N+1 für die auf diesen vier Servern ausgeführten Instanzen aufrechtzuerhalten. Wenn ein Server ausfällt, ist ausreichend Platz vorhanden, um die ausgefallenen Instanzen auf den verbleibenden Servern neu zu starten.

Diagramm, das die Visualisierung von EC2 Server-Slots, laufenden Instances und Slot-Pools zeigt

Visualisierung von EC2 Server-Slots, laufenden Instanzen und Slot-Pools

Bei komplexeren Steckplatz-Layouts, bei denen die Server nicht identisch sind, müssen Sie die N+M-Verfügbarkeit für jeden Kapazitätspool berechnen. EC2 Sie können die folgende Formel verwenden, um zu berechnen, wie viele Server (die Steckplätze zu einem bestimmten EC2 Kapazitätspool beitragen) ausfallen können und die verbleibenden Server trotzdem die laufenden Instances übertragen können:

Gleichung M = (verfügbare Poolsteckplätze/maximale Serversteckplätze)

Wobei gilt:

  • poolSlotsavailableist die Anzahl der verfügbaren Steckplätze im angegebenen EC2 Kapazitätspool (Gesamtzahl der Steckplätze im Pool abzüglich der Anzahl der laufenden Instanzen)

  • serverSlotsmaxist die maximale Anzahl von Steckplätzen, die von einem Server zum angegebenen EC2 Kapazitätspool beigetragen werden

  • M ist die Anzahl der Server, die ausfallen können und die es den verbleibenden Servern trotzdem ermöglichen, die laufenden Instances zu übertragen

Beispiel: Ein Outpost hat drei Server, die Steckplätze zu einem m5.2xlarge Kapazitätspool beitragen. Der erste trägt 4 Steckplätze, der zweite 3 Steckplätze und der dritte Server 2 Steckplätze bei. Der m5.2xlarge Instance-Pool auf dem Outpost hat eine Gesamtkapazität von 9 Steckplätzen (4 + 3 +2). Der Outpost hat 4 laufende m5.2xlarge Instances. Wie viele Server fallen möglicherweise aus und ermöglichen es den verbleibenden Servern trotzdem, die laufenden Instanzen zu übertragen?

Drei Gleichungen

Antwort: Sie können einen der Server verlieren und trotzdem die laufenden Instances auf den verbleibenden Servern weiterführen.

  • Passen Sie Ihre Rechenkapazität an, um N+M-Redundanz für jeden EC2 Kapazitätspool auf einem Outpost bereitzustellen.

    • Stellen Sie N+M-Server für homogene oder identische Server mit heterogenen Steckplätzen bereit.

    • Berechnen Sie die N+M-Verfügbarkeit für jeden EC2 Kapazitätspool und stellen Sie sicher, dass jeder Pool Ihren Verfügbarkeitsanforderungen entspricht.