Unterstützung für die Verbesserung dieser Seite beitragen
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Um zu diesem Benutzerhandbuch beizutragen, wählen Sie den GitHub Link Diese Seite bearbeiten auf, der sich im rechten Bereich jeder Seite befindet.
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Von Amazon EKS bereitgestellte Kontrollebene
-Übersicht
Amazon EKS Provisioned Control Plane ist eine Funktion, mit der Cluster-Administratoren aus einer Reihe von Skalierungsstufen auswählen und die von ihnen gewählte Stufe für eine sehr hohe, vorhersehbare Leistung von der Steuerungsebene des Clusters aus festlegen können. Auf diese Weise können Clusteradministratoren sicherstellen, dass die Kontrollebene immer mit der angegebenen Kapazität bereitgestellt wird.
Amazon EKS bietet zwei Betriebsmodi für die Steuerungsebene Ihres Clusters. Standardmäßig verwenden Amazon EKS-Cluster den Standardmodus, in dem die Steuerungsebene je nach Ihren Workload-Anforderungen automatisch nach oben und unten skaliert wird. Der Standardmodus weist dynamisch ausreichend Kapazität auf der Steuerungsebene zu, um Ihren Workload-Anforderungen gerecht zu werden. Dies ist die empfohlene Lösung für die meisten Anwendungsfälle. Für spezielle Workloads, die aufgrund der Skalierung der Steuerungsebene keine Leistungsschwankungen tolerieren können, oder solche, die eine sehr hohe Kapazität der Steuerungsebene erfordern, können Sie jedoch optional den Bereitstellungsmodus verwenden. Im Bereitstellungsmodus können Sie die Kapazität der Steuerungsebene vorab zuweisen, sodass diese stets bereit ist, anspruchsvolle Workload-Anforderungen zu bewältigen.
Anmerkung
Der Bereitstellungsmodus ist neben dem standardmäßigen Standardmodus ein zusätzlicher Betriebsmodus auf der Steuerungsebene. Durch die Einführung des Bereitstellungsmodus wird das Verhalten im Standardmodus nicht geändert.
Mit EKS Provisioned Control Plane können Clusteradministratoren die gewünschte Kapazität der Steuerungsebene im Voraus bereitstellen und so eine vorhersehbare und hohe Leistung von der Steuerungsebene des Clusters aus gewährleisten, die immer verfügbar ist. EKS Provisioned Control Plane ermöglicht es Clusteradministratoren außerdem, dieselbe Kapazität der Steuerungsebene in allen Umgebungen bereitzustellen, vom Staging über die Produktion bis hin zu den Standorten für die Notfallwiederherstellung. Dies ist wichtig, um sicherzustellen, dass die Leistung der Kontrollebene in allen Umgebungen konsistent und vorhersehbar ist. Schließlich bietet Ihnen EKS Provisioned Control Plane Zugriff auf ein sehr hohes Maß an Leistung auf der Kontrollebene und ermöglicht so die Ausführung von massiv skalierbaren KI-Workloads, Hochleistungscomputing und umfangreichen Datenverarbeitungs-Workloads auf Kubernetes.
Alle vorhandenen und neuen Amazon EKS-Cluster arbeiten standardmäßig im Standardmodus. Für Cluster, die eine hohe, vorhersehbare Leistung auf der Kontrollebene erfordern, können Sie sich für die Verwendung der EKS Provisioned Control Plane-Funktion entscheiden. Ihnen wird der Stundensatz für die jeweilige Skalierungsstufe der Steuerungsebene zusätzlich zu den EKS-Stundengebühren für den standardmäßigen oder erweiterten Support in Rechnung gestellt. Weitere Informationen zur Preisgestaltung finden Sie unter Amazon EKS-Preise
Anwendungsfälle
EKS Provisioned Control Plane wurde für spezifische Szenarien entwickelt, in denen eine hohe und vorhersehbare Leistung der Kontrollebene für Ihren Betrieb entscheidend ist. Wenn Sie diese Anwendungsfälle verstehen, können Sie feststellen, ob EKS Provisioned Control Plane die richtige Lösung für Ihre Workloads ist.
Leistungskritische Workloads — Für Workloads, die minimale Latenz und maximale Leistung von der Kubernetes-Steuerebene erfordern, bietet EKS Provisioned Control Plane Kapazität, die Leistungsschwankungen durch Skalierung der Kontrollebene ausschließt.
Extrem skalierbare Workloads — Wenn Sie hoch skalierbare Workloads wie KI-Training und Inferenz, Hochleistungscomputing oder umfangreiche Datenverarbeitung ausführen, für die eine große Anzahl von Knoten im Cluster erforderlich ist, bietet Provisioned Control Plane die erforderliche Kapazität der Steuerungsebene, um diese anspruchsvollen Workloads zu unterstützen.
Erwartete Ereignisse mit hoher Nachfrage — Wenn Sie aufgrund eines bevorstehenden Ereignisses wie E-Commerce-Verkäufen oder Werbeaktionen, Produkteinführungen, Weihnachtseinkäufen oder großen Sport- oder Unterhaltungsereignissen mit einem plötzlichen Anstieg der Anfragen auf Kontrollebenen rechnen, können Sie mit Provisioned Control Plane die Kapazität Ihrer Kontrollebene im Voraus skalieren. Dieser proaktive Ansatz stellt sicher, dass Ihre Steuerungsebene bereit ist, die erhöhte Last zu bewältigen, ohne auf die automatische Skalierung warten zu müssen, um auf die Nachfrage zu reagieren.
Konsistenz der Umgebung — Mit der bereitgestellten Kontrollebene können Sie die Kapazität und Leistung der Steuerungsebene in allen Staging- und Produktionsumgebungen aufeinander abstimmen, sodass Sie potenzielle Probleme frühzeitig erkennen können, bevor sie in der Produktion eingesetzt werden. Durch die Beibehaltung derselben Kontrollebenenebene in allen Umgebungen können Sie sicherstellen, dass die Testergebnisse das Produktionsverhalten genau widerspiegeln, wodurch das Risiko leistungsbedingter Überraschungen bei der Einführung verringert wird.
Notfallwiederherstellung und Geschäftskontinuität — Für Notfallwiederherstellungsszenarien ermöglicht Ihnen Provisioned Control Plane die Bereitstellung von Failover-Umgebungen mit derselben Kapazität wie Ihre primäre Umgebung. Dies gewährleistet minimale Unterbrechungen und eine schnelle Wiederherstellung bei Failover-Ereignissen, da Ihr Disaster Recovery-Cluster ab dem Moment der Aktivierung über identische Leistungsmerkmale auf der Steuerungsebene wie Ihr Produktionscluster verfügt.
Skalierungsstufen auf der Steuerungsebene
EKS Provisioned Control Plane bietet Skalierungsstufen, die nach T-Shirt-Größen (XL, 2XL, 4XL) benannt sind. Jede Stufe definiert ihre Kapazität anhand von drei wichtigen Kubernetes-Attributen, die die Leistungsmerkmale der Kontrollebene Ihres Clusters bestimmen. Wenn Sie diese Attribute verstehen, können Sie die passende Stufe für Ihre Workload-Anforderungen auswählen.
Bei der Parallelität von API-Anfragen wird die Anzahl der Anfragen gemessen, die der API-Server der Kubernetes-Steuerebene gleichzeitig verarbeiten kann. Dies ist für Workloads mit hohem Durchsatz von entscheidender Bedeutung.
Die Pod-Scheduling-Rate gibt an, wie schnell der standardmäßige Kubernetes-Scheduler Pods auf Knoten einplanen kann, gemessen in Pods pro Sekunde.
Die Größe der Cluster-Datenbank gibt den Speicherplatz an, der etcd zugewiesen ist, der Datenbank, die den Clusterstatus/die Metadaten enthält.
Wenn Sie die Steuerungsebene Ihres Clusters mithilfe von Provisioned Control Plane auf einer bestimmten Skalierungsebene bereitstellen, stellt EKS sicher, dass die Steuerungsebene Ihres Clusters die dieser Ebene entsprechenden Grenzwerte einhält. Die Grenzen der Skalierungsebenen auf der Kontrollebene variieren je nach Kubernetes-Version, wie in den folgenden Tabellen dargestellt.
EKS v1.28 und v1.29
| Skalierungsstufe der bereitgestellten Steuerungsebene | Parallelität von API-Anfragen (Sitze) | Pod-Planungsrate (Pods/Sekunde) | Größe der Cluster-Datenbank (GB) |
|---|---|---|---|
|
XL |
1700 |
100 |
16 |
|
2 XL |
3400 |
100 |
16 |
|
4 XL |
6800 |
100 |
16 |
EKS v1.30 und höher
| Skalierungsstufe der bereitgestellten Steuerungsebene | Parallelität von API-Anfragen (Sitze) | Pod-Planungsrate (Pods/Sekunde) | Größe der Cluster-Datenbank (GB) |
|---|---|---|---|
|
XL |
1700 |
167 |
16 |
|
2 XL |
3400 |
283 |
16 |
|
4 XL |
6800 |
400 |
16 |
Überwachung der Steuerungsebene, Skalierung der Tier-Auslastung
Amazon EKS bietet mehrere Metriken, mit denen Sie die Tier-Auslastung Ihrer Kontrollebene überwachen können. Diese Metriken werden als CloudWatch Amazon-Metriken veröffentlicht und sind über die CloudWatch EKS-Konsole zugänglich. Darüber hinaus können diese Metriken vom Prometheus-Endpunkt Ihres EKS-Clusters abgerufen werden (siehe hier).
| Prometheus-Metrik | CloudWatch Metrik | |
|---|---|---|
|
Parallelität von API-Anfragen |
apiserver_flowcontrol_current_executing_seats |
apiserver_flowcontrol_current_executing_seats |
|
Tarif für die Planung von Pods |
scheduler_schedule_attempts_total |
scheduler_schedule_attempts_total, Scheduler_Schedule_Attempts_Scheduled, Scheduler_Schedule_Attempts_Unschedulable |
|
Größe der Cluster-Datenbank |
apiserver_storage_size_bytes |
apiserver_speichergröße_bytes |
Erläuterung der Tier-Kapazität im Vergleich zur tatsächlichen Leistung
Wenn Sie eine Skalierungsstufe für die bereitgestellte Kontrollebene auswählen, stellen die Tierattribute die zugrunde liegenden Konfigurationen dar, die Amazon EKS auf Ihre Kontrollebene anwendet. Die tatsächliche Leistung, die Sie erzielen, hängt jedoch von Ihren spezifischen Workload-Mustern und Konfigurationen und der Einhaltung der Best Practices von Kubernetes ab. Während bei einer Stufe 4XL beispielsweise API Priority and Fairness (APF) mit 6.800 gleichzeitigen Anforderungsplätzen konfiguriert wird, hängt der tatsächliche Anforderungsdurchsatz, den Sie von der Steuerungsebene erhalten, von der Art der ausgeführten Operationen ab. Kubernetes bestraft beispielsweise Listenanfragen stärker als Get-Anfragen, sodass die effektive Anzahl von Listenanfragen, die gleichzeitig von der Steuerebene verarbeitet werden, geringer ist als die von Get-Anfragen (siehe hier). Auch wenn der Standard-Scheduler-QPS für ein 4XL-Tier auf 400 gesetzt ist, hängt Ihre tatsächliche Pod-Scheduling-Rate von Faktoren wie der Bereitschaft der Knoten und dem Zustand der Knoten für die Planung ab. Um eine optimale Leistung zu erzielen, sollten Sie sicherstellen, dass Ihre Anwendungen den Best Practices von Kubernetes folgen (siehe hier) und dass sie für Ihre Workload-Merkmale richtig konfiguriert sind.
Überlegungen
-
Kapazität der Standard-Steuerungsebene — Der Standard-Steuerungsebenenmodus von EKS bietet das beste Preis-Leistungs-Verhältnis und ist die empfohlene Option für die meisten Anwendungsfälle. Für spezielle Workloads, die keine Leistungsschwankungen aufgrund der Skalierung der Steuerungsebene tolerieren können, oder solche, die eine sehr hohe Kapazität der Steuerungsebene erfordern, können Sie jedoch optional den Bereitstellungsmodus in Betracht ziehen.
-
Opt-In erforderlich — Bestehende Cluster werden nicht automatisch von der Standard-Steuerebene auf eine teurere
EKS Provisioned Control Plane Stufe hochskaliert. Sie müssen sich ausdrücklich für eine der neuen Skalierungsstufen von EKS Provisioned Control Plane entscheiden. -
Ausgangsbeschränkung — Der Standardmodus der Steuerungsebene unterstützt eine Cluster-Datenbankgröße (etcd) von bis zu 8 GB. Wenn die Datenbankgröße Ihres Clusters im Bereitstellungsmodus 8 GB überschreitet, können Sie erst wieder in den Standardmodus wechseln, wenn Sie die Datenbankgröße auf unter 8 GB reduziert haben. Wenn Sie beispielsweise 14 GB Datenbankspeicher im Bereitstellungsmodus verwenden, müssen Sie zunächst die Datenbankauslastung auf weniger als 8 GB reduzieren, bevor Sie zum Standardmodus zurückkehren.
-
Keine automatische Stufenskalierung — EKS Provisioned Control Plane skaliert nicht automatisch zwischen den Stufen. Sobald Sie eine Skalierungsstufe ausgewählt haben, bleibt die Steuerungsebene Ihres Clusters an diese Stufe gebunden, sodass eine konsistente und vorhersehbare Leistung gewährleistet ist. Sie haben jedoch die Flexibilität, Ihre eigene Autoscaling-Lösung zu implementieren, indem Sie die Nutzungskennzahlen der Stufen überwachen und mithilfe der EKS Provisioned Control Plane APIs nach oben oder unten skalieren, wenn diese Metriken die von Ihnen definierten Schwellenwerte überschreiten, sodass Sie die volle Kontrolle über Ihre Skalierungsstrategie und Kostenoptimierung haben.
-
Aktuelle Stufe anzeigen — Sie können die Amazon EKS-Konsole, Amazon Web Services CLI oder API verwenden, um die aktuelle Skalierungsstufe der Steuerungsebene anzuzeigen. In der CLI können Sie den
describe-clusterfolgenden Befehl ausführen:aws eks describe-cluster --name cluster-name -
Zeit für den Tier-Übergang — Sie können die Amazon EKS-Konsole, Amazon EKS oder CLI verwenden APIs, um die Skalierungsstufen zu beenden oder zwischen ihnen zu wechseln. Amazon EKS hat einen neuen Cluster-Aktualisierungstyp namens eingeführt
ScalingTierConfigUpdate, den Sie überprüfen können, um den Fortschritt der Umstellung zu überwachen. Nachdem Sie einen Befehl zur Änderung der Stufe ausgeführt haben, können Sie die Updates auf dem Cluster auflisten, um ein neues Update des TypsScalingTierConfigUpdatemit Status zu sehenUpdating. Der StatusSuccessfulwird nach Abschluss des Updates oder bei Auftreten einesFailedFehlers auf geändert. Das Fehlerfeld im Update gibt den Grund für den Fehler an. Es gibt keine Einschränkungen, wie oft Sie zwischen den Stufen wechseln können. Das Ändern der Stufe der Steuerungsebene dauert mehrere Minuten. -
Auswahl der optimalen Stufe — Um die optimale Skalierungsstufe der Provisioned Control Plane für Ihren Cluster zu ermitteln, können Sie Lasttests durchführen, indem Sie Ihren Cluster auf der höchsten Stufe (4XL) bereitstellen. Führen Sie anschließend einen Lasttest durch, um Spitzenlasten auf der Steuerungsebene Ihres Clusters zu simulieren. Beobachten Sie die Nutzungsmetriken der Kontrollebene bei Spitzenlast und verwenden Sie diese Beobachtungen als Richtschnur für die Auswahl der geeigneten Stufe für den Bereitstellungsmodus.
-
Preise für die bereitgestellte Kontrollebene — Ihnen wird der Stundensatz für die Skalierungsstufe „Provisioned Control Plane“ in Rechnung gestellt, auf der sich Ihr Cluster befindet. Dies gilt zusätzlich zu den stündlichen Gebühren für Standard- oder erweiterten Support. Weitere Informationen finden Sie auf der Amazon EKS-Preisseite
. -
Größere Skalierungsstufe — Wenn Sie beabsichtigen, Ihren Cluster auf einer Skalierungsstufe von mehr als 4XL auszuführen, wenden Sie sich an Ihr Amazon Web Services Services-Kundenbetreuungsteam, um weitere Preisinformationen zu erhalten.
-
Unterstützung für Kubernetes-Versionen und Regionen — EKS Provisioned Control Plane wird in allen kommerziellen und China Regionen von Amazon Web Services unterstützt. GovCloud Provisioned Control Plane funktioniert auf EKS v1.28 und höher.