Übersicht über die Verwaltung von Clustern in Amazon Redshift - Amazon Redshift

Übersicht über die Verwaltung von Clustern in Amazon Redshift

Nachdem Ihr Cluster erstellt wurde, können Sie mehrere Vorgänge ausführen. Zu den Operationen gehören die Größenanpassung, das Anhalten, das Fortsetzen, das Umbenennen und das Löschen.

Größenanpassung von Clustern in Amazon Redshift

Wenn sich Ihre Data-Warehousing-Kapazität bzw. -Leistung ändern oder vergrößern müssen, können Sie die Größe Ihres Clusters anpassen, um die von Amazon Redshift gebotenen Datenverarbeitungs- und Speicheroptionen optimal zu nutzen.

Sie können die elastische Größenanpassung zur Skalierung des Clusters verwenden, indem Sie die Anzahl der Knoten ändern. Wir empfehlen, die elastische Größenanpassung zu verwenden, die normalerweise innerhalb von Minuten abgeschlossen wird. Wenn Ihre neue Knotenkonfiguration nicht über die elastische Größenanpassung verfügbar ist, können Sie die klassische Größenanpassung verwenden. Die klassische Größenanpassung benötigt mehr Zeit, da sie die Bereitstellung eines neuen Clusters und das Kopieren von Datenblöcken in diesen Cluster erfordert. Im Gegensatz dazu werden durch die elastische Größenanpassung Daten-Slices neu verteilt, was weniger Ressourcen erfordert.

Verwenden Sie einen der folgenden Ansätze, um die Größe des Clusters zu ändern:

  • Elastic resize (Elastische Größenanpassung) – Verwenden Sie die elastische Größenanpassung, um den Knotentyp, die Anzahl der Knoten oder beides zu ändern. die elastische Größenanpassung funktioniert schnell, indem Sie Knoten zu Ihrem vorhandenen Cluster ändern oder hinzufügen. Wenn Sie die Anzahl der Knoten ändern, werden Abfragen vorübergehend angehalten und Verbindungen offen gehalten, wenn möglich. In der Regel dauert die elastische Größenanpassung 10 bis 15 Minuten. Während der Größenänderung ist der Cluster schreibgeschützt.

    Wir empfehlen die Verwendung der elastischen Größenanpassung wann immer möglich, da sie viel schneller abgeschlossen ist als die klassische Größenanpassung.

  • Classic resize (Klassische Größenanpassung) – Verwenden Sie die elastische Größenanpassung, um den Knotentyp, die Anzahl der Knoten oder beides zu ändern. Mit der klassischen Größenanpassung wird ein neuer Cluster bereitgestellt und die Daten vom Quellcluster werden in den neuen Cluster kopiert. Wählen Sie diese Option nur aus, wenn Sie die Konfiguration auf eine Größe ändern, die über die elastische Größenanpassung nicht verfügbar ist, da die klassische Größenanpassung deutlich mehr Zeit in Anspruch nimmt. Ein Beispiel für die Verwendung dieser Option ist die Größenanpassung zu oder von einem Einzelknoten-Cluster. Während der Größenänderung ist der Cluster schreibgeschützt. Die klassische Größenanpassung kann mehrere Stunden bis zu mehreren Tagen oder länger dauern, abhängig von der Menge der zu übertragenden Daten und dem Unterschied in der Clustergröße und den Rechenressourcen.

    Wenn Ihre Konfiguration eine klassische Größenanpassung erfordert, können Sie die Auswirkungen auf die Produktion minimieren, indem Sie eine Kopie des vorhandenen Clusters erstellen und anschließend die Größe der Kopie ändern. Snapshot, Wiederherstellung und Größenanpassungbeschreibt die Schritte.

Sie können die Größe Ihres Clusters (sowohl elastische als auch klassische Größenanpassung) nach einem Zeitplan ändern. Wenn Sie die neue Amazon-Redshift-Konsole verwenden, können Sie einen Zeitplan zum Ändern der Größe des Clusters einrichten. Weitere Informationen finden Sie unter Größenanpassung eines Clusters. Sie können auch die AWS CLI- oder Amazon-Redshift-API-Operation verwenden, um eine Größenanpassung zu planen. Weitere Informationen finden Sie unter create-schedule-action in der AWS CLI-Befehlsreferenz oder unter CreateScheduledAction in der Amazon-Redshift-API-Referenz.

Elastic resize (Elastische Größenanpassung)

Die elastische Größenanpassung stellt die schnellste Möglichkeit für die Anpassung der Größe eines Clusters dar. Sie können die elastische Größenänderung verwenden, um Knoten hinzuzufügen oder zu entfernen und Knotentypen zu ändern.

Wenn die Größe eines Clusters mithilfe der elastischen Größenänderung mit demselben Knotentyp geändert wird, werden die Daten automatisch an die neuen Knoten weiterverteilt. Da bei diesem Szenario kein neuer Cluster erstellt wird, nimmt die elastische Größenanpassung normalerweise nur wenige Minuten in Anspruch. Möglicherweise bemerken Sie eine geringe Erhöhung der Ausführungszeit für einige Abfragen, während die Daten im Hintergrund neu verteilt werden. Eine elastische Größenanpassung tritt in den folgenden Phasen ein:

  1. Bei der elastischen Größenanpassung wird ein Cluster-Snapshot erstellt.

    Der bei der elastischen Größenanpassung erstellte Snapshot enthält Tabellen ohne Sicherung. Wenn Ihr Cluster keinen aktuellen Snapshot hat, weil Sie automatische Snapshots deaktiviert haben, dauert der Sicherungsvorgang länger. Um die Zeit bis zum Beginn der Größenanpassung zu minimieren, empfehlen wir, automatische Snapshots zu aktivieren oder einen manuellen Snapshot zu erstellen, bevor Sie eine elastische Größenanpassung vornehmen. Wenn Sie eine elastische Größenanpassung starten und derzeit ein Snapshot-Vorgang ausgeführt wird, schlägt die elastische Größenanpassung möglicherweise fehl, wenn der Snapshot-Vorgang nicht innerhalb weniger Minuten abgeschlossen wird. Weitere Informationen finden Sie unter Amazon-Redshift-Snapshots.

  2. Wenn Cluster-Metadaten während der elastischen Größenanpassung migriert werden, ist der Cluster vorübergehend nicht verfügbar.

    Diese Etappe ist sehr kurz, sie dauert höchstens ein paar Minuten. Amazon Redshift hält Sitzungsverbindungen aufrecht und Abfragen verbleiben in der Warteschlange. Bei einigen Sitzungen und Abfragen kann es zu einer Zeitüberschreitung kommen.

  3. Die Sitzungsverbindungen werden wiederhergestellt und die Abfragen fortgesetzt.

  4. Während der elastischen Größenanpassung werden Daten an die Knoten-Slices im Hintergrund verteilt.

    Der Cluster ist für Lese- und Schreibvorgänge verfügbar, die Ausführung einiger Abfragen könnte jedoch mehr Zeit in Anspruch nehmen.

Wenn die Größe eines Clusters mithilfe der elastischen Größenänderung geändert wird, um den Knotentyp zu ändern, wird ein Snapshot erstellt. Ein neuer Cluster wird für Sie mit den neuesten Daten aus dem Snapshot bereitgestellt. Der Cluster ist vorübergehend nicht für Schreibvorgänge verfügbar, wenn die Daten an den neuen Cluster übertragen werden. Er steht für Lesevorgänge zur Verfügung. Der neue Cluster wird im Hintergrund aufgefüllt. Nachdem der neue Cluster vollständig gefüllt ist, erreichen Abfragen die optimale Leistung. Wenn der Größenänderungsprozess kurz vor dem Abschluss steht, aktualisiert Amazon Redshift den Endpunkt des neuen Clusters und alle Verbindungen zum ursprünglichen Cluster werden beendet.

Amazon Redshift sendet nach Abschluss der Größenänderung eine Ereignisbenachrichtigung. Sie können dann eine Verbindung zum neuen Cluster herstellen und Lese- und Schreibabfragen ausführen.

Wenn Sie reservierte Knoten haben, zum Beispiel reservierte DS2-Knoten, können Sie auf reservierte RA3-Knoten aktualisieren. Sie können dies tun, wenn Sie über die Konsole eine Wiederherstellung von einem Snapshot oder eine elastische Größenanpassung durchführen. Sie können die Konsole verwenden, um sich durch den Prozess führen zu lassen. Weitere Informationen zum Aktualisieren auf RA3-Knoten finden Sie unter Migration zu RA3-Knotentypen.

Um den Fortschritt einer Größenanpassungs-Operation mit der Amazon-Redshift-Konsole zu überwachen, wählen Sie CLUSTERS (CLUSTER) und dann den Cluster aus, dessen Größe geändert wird.

Sie können die elastische Größenanpassung nicht für Einzelknoten-Cluster verwenden.

Um eine elastische Größenanpassung auf einem Cluster auszuführen, der Daten aus einem freigegebenen Snapshot überträgt, muss mindestens eine Sicherung für den Cluster verfügbar sein. Sie können Ihre Backups in der Konsolen-Snapshot-Liste von Amazon Redshift, im describe-cluster-snapshots-CLI-Befehl oder in der API-Operation DescribeClusterSnapshots anzeigen.

Bei der elastischen Größenanpassungen werden keine Tabellensortierungen durchgeführt und es wird kein Speicherplatz freigegeben. Daher ist sie kein Ersatz für einen Bereinigungsoperation. Bei der klassischen Größenanpassung werden Tabellen in einen neuen Cluster kopiert. Dadurch kann die Notwendigkeit einer Bereinigung reduziert werden. Weitere Informationen finden Sie unter Bereinigen von Tabellen.

Für die elastische Größenanpassung gelten die folgenden Einschränkungen:

  • Die elastische Größenanpassung ist nur für Cluster verfügbar, die die EC2-VPC-Plattform verwenden. Weitere Informationen finden Sie unter Verwenden von EC2-VPC beim Erstellen Ihres Clusters.

  • Stellen Sie sicher, dass Ihre neue Knotenkonfiguration über genügend Speicherplatz für vorhandene Daten verfügt. Auch wenn Sie Knoten hinzufügen, verfügt Ihre neue Konfiguration möglicherweise aufgrund der Verteilung der Daten nicht über ausreichend Speicherplatz.

  • Die möglichen Konfigurationen der Knotenanzahl und des Knotentyps, deren Größe Sie ändern können, werden durch die Anzahl der Knoten im ursprünglichen Cluster und durch den Zielknotentyp des größenangepassten Clusters bestimmt. Zum Ermitteln der verfügbaren Konfigurationen können Sie die Konsole verwenden. Sie können den AWS CLI-Befehl describe-node-configuration-options auch mit der Option action-type resize-cluster ausführen. Weitere Informationen zur Größenanpassung mithilfe der Amazon-Redshift-Konsole finden Sie unter Größenanpassung eines Clusters.

    Der folgende CLI-Beispielbefehl beschreibt die möglichen Konfigurationsoptionen. In diesem Beispiel handelt es sich bei dem Cluster mycluster um einen dc2.large-Cluster mit acht Knoten.

    aws redshift describe-node-configuration-options --cluster-identifier mycluster --region eu-west-1 --action-type resize-cluster

    Dieser Befehl gibt eine Optionenliste mit empfohlenen Knotentypen, der Knotenanzahl und der Festplattennutzung für jede Option aus. Die zurückgegebenen Konfigurationen können basierend auf dem spezifischen Eingabe-Cluster variieren. Sie können eine dieser Konfigurationen auswählen, wenn Sie die Optionen des CLI-Befehls resize-cluster angeben.

  • Die elastische Größenanpassung hat Beschränkungen für die Knoten, die Sie einem Cluster hinzufügen können. Beispielsweise unterstützt ein dc2-Cluster die elastische Größenanpassung bis zur doppelten Anzahl der Knoten. Zur Veranschaulichung können Sie einem Cluster dc2.8xlarge mit 4 Knoten einen Knoten hinzufügen, um ihn zu einem Cluster mit 5 Knoten zu machen, oder weitere Knoten hinzufügen, bis Sie 8 erreichen.

    Bei einigen ra3-Knotentypen können Sie die Anzahl der Knoten um das Vierfache der vorhandenen Anzahl erhöhen. Gehen wir davon aus, Ihr Cluster besteht aus ra3.4xlarge oder ra3.16xlarge Knoten. Anschließend können Sie die elastische Größenanpassung verwenden, um die Anzahl der Knoten in einem Cluster mit 8 Knoten auf 32 zu erhöhen. Oder Sie können einen Wert unter dem Limit auswählen. Wenn Ihr Cluster ra3.xlplus-Knoten hat, ist das Limit doppelt so hoch.

    Alle ra3-Knotentypen unterstützen eine Verringerung der Anzahl der Knoten auf ein Viertel der vorhandenen Anzahl. Beispielsweise können Sie die Größe eines Clusters mit ra3.4xlarge-Knoten von 12 Knoten auf 3 oder auf eine Zahl über dem Minimum verringern.

    In der folgenden Tabelle sind die Wachstums- und Reduktionsgrenzen für jeden Knotentyp aufgeführt, der die elastische Größenanpassung unterstützt.

    Knotentyp Grenzwert Begrenzung der Reduzierung

    ra3.16xlarge

    4x (von 4 bis 16 Knoten, zum Beispiel)

    Ein Viertel der Zahl (von 16 bis 4 Knoten, zum Beispiel)

    ra3.4xlarge

    4x

    Ein Viertel der Zahl

    ra3.xlplus

    2x (von 4 bis 8 Knoten, zum Beispiel)

    Ein Viertel der Zahl

    dc2.8xlarge

    2x

    Die Hälfte der Zahl (von 16 bis 8 Knoten, zum Beispiel)

    dc2.large

    2x

    Die Hälfte der Zahl

    ds2.8xlarge

    2x

    Die Hälfte der Zahl

    ds2.xlarge

    2x

    Die Hälfte der Zahl

Classic resize (Klassische Größenanpassung)

Mit der klassischen Größenanpassung werden Ihre Daten parallel von dem/den Datenverarbeitungsknoten in Ihrem Quellcluster zu den entsprechenden Knoten im Zielcluster kopiert. Die für die Größenanpassung erforderliche Zeit hängt von der Datenmenge und der Anzahl der Knoten in dem kleineren Cluster ab. Dabei kann es sich um einige Stunden bis zu einigen Tagen oder länger handeln.

Die Dauer einer klassischen Größenänderung variiert basierend auf verschiedenen Faktoren, einschließlich:

  • Die Workload auf dem Quell-Cluster.

  • Anzahl und Größe der übertragenen Tabellen.

  • Wie gleichmäßig Daten über die Datenverarbeitungsknoten und Slices verteilt werden.

  • Die Knotenkonfiguration in den Quell- und Ziel-Clustern.

Wenn Sie die Größenanpassungsoperation starten, versetzt Amazon Redshift den vorhandenen Cluster in den schreibgeschützten Modus, bis die Größenanpassung abgeschlossen ist. Während dieser Zeit können Sie nur Abfragen ausführen, die aus der Datenbank gelesen werden. Sie können keine Abfragen ausführen, die in die Datenbank schreiben, einschließlich Lese-/Schreibabfragen. Weitere Informationen finden Sie unter Write and read-write operations (Schreib- und Lese-Schreib-Operationen) im Entwicklerhandbuch für Amazon Redshift Database.

Anmerkung

Um eine Größenanpassung mit minimalen Auswirkungen auf die Produktion durchführen, führen Sie die Schritte im folgenden Abschnitt aus., Snapshot, Wiederherstellung und Größenanpassung. Sie können anhand dieser Schritte eine Kopie Ihres Clusters erstellen, deren Größe anpassen und anschließend den Verbindungsendpunkt zum angepassten Cluster wechseln, nachdem die Größenanpassung abgeschlossen ist.

Sowohl bei der klassischen Größenanpassung als auch bei der Vorgehensweise mit Snapshot und Wiederherstellung werden Benutzertabellen und -daten zum neuen Cluster kopiert; Systemtabellen und -daten werden nicht aufbewahrt. Wenn Sie die Auditprotokollierung in Ihrem Quellcluster aktiviert haben, können Sie sowohl bei der klassischen Größenanpassung als auch bei der Vorgehensweise mit Snapshot und Wiederherstellung weiterhin auf die Protokolle in Amazon S3 zugreifen. Mit diesen Vorgehensweisen können Sie nach dem Löschen des Quellclusters weiterhin auf die Protokolle zugreifen. Sie können diese Protokolle je nach Vorgabe Ihrer Datenrichtlinien behalten oder löschen Bei der elastischen Größenanpassung werden die Systemprotokolltabellen aufbewahrt.

Nachdem Amazon Redshift den Quellcluster in den schreibgeschützten Modus versetzt hat, wird ein neuer Cluster bereitgestellt, der Zielcluster. Dafür werden die von Ihnen angegebenen Informationen zu Knotentyp, Clustertyp und der Anzahl der Knoten verwendet. Dann kopiert Amazon Redshift die Daten vom Quellcluster zum Zielcluster. Wenn dies abgeschlossen ist, wechseln alle Verbindungen zur Verwendung des Zielclusters. Wenn zum Zeitpunkt dieses Wechsels Abfragen ausgeführt werden, geht Ihre Verbindung verloren und Sie müssen die Abfrage auf dem Zielcluster erneut starten. Sie können den Fortschritt der Größenanpassung auf der Amazon-Redshift-Konsole anzeigen.

Amazon Redshift sortiert die Tabellen während einer Größenanpassung nicht, die bestehende Sortierreihenfolge bleibt daher erhalten. Wenn Sie die Größe eines Clusters anpassen, verteilt Amazon Redshift die Datenbanktabellen auf der Grundlage Ihrer Verteilungsstile auf die neuen Knoten und führt einen ANALYZE-Befehl aus, um die Statistik zu aktualisieren. Zur Löschung markierte Zeilen werden nicht übertragen, Sie müssen daher nur dann einen VACUUM-Befehl ausführen, wenn Ihre Tabellen neu sortiert werden müssen. Weitere Informationen finden Sie unter Bereinigen von Tabellen im Datenbankentwicklerhandbuch zu Amazon Redshift.

Sie können eine klassische Größenanpassung abbrechen, bevor sie abgeschlossen ist. Wählen Sie dafür Cancel resize (Größenanpassung abbrechen) in den Clusterdetails in der Amazon-Redshift-Konsole. Die zum Abbrechen einer Größenanpassung erforderliche Zeit hängt davon ab, in welcher Stufe sich die Größenanpassung gerade befindet, wenn sie abgebrochen wird. Der Cluster ist erst verfügbar, wenn die Größenanpassung vollständig abgeschlossen wurde. Wenn sich die Größenanpassung in der letzten Stufe befindet, können Sie sie nicht mehr abbrechen.

Snapshot, Wiederherstellung und Größenanpassung

Wie im vorherigen Abschnitt beschrieben, hängt die für die Größenanpassung eines Clusters mit der klassischen Größenanpassung erforderliche Zeit stark von der Menge der Daten in dem Cluster ab.

Die elastische Größenanpassung stellt die schnellste Möglichkeit für die Anpassung der Größe eines Amazon-Redshift-Clusters dar. Wenn die elastische Größenanpassung keine Option für Sie darstellt und Sie einen annähernd konstanten Schreibzugriff auf Ihren Cluster benötigen, verwenden Sie die im folgenden Abschnitt beschriebene Snapshot- und Wiederherstellungsoperationen mit klassischer Größenanpassung. Dafür ist es erforderlich, dass alle Daten, die nach der Erstellung des Snapshots zum Quellcluster geschrieben werden, nach dem Wechsel manuell zum Zielcluster kopiert werden. Je nachdem, wie lange der Kopiervorgang dauert, müssen Sie dies möglicherweise mehrmals wiederholen, bis sich in beiden Clustern die gleichen Daten befinden. Anschließend können Sie den Wechsel zum Zielcluster durchführen. Dieser Prozess kann negative Auswirkungen auf bestehende Abfragen haben, bis alle Daten im Zielcluster verfügbar sind. Er minimiert jedoch den Zeitraum, in dem keine Schreibvorgänge in der Datenbank möglich sind.

Der Snapshot-, Wiederherstellungs- und klassische Größenanpassungsansatz verwendet den folgenden Prozess:

  1. Erstellen Sie einen Snapshot des bestehenden Clusters. Der bestehende Cluster ist der Quellcluster.

  2. Notieren Sie sich die Erstellungszeit des Snapshots. Auf diese Weise können Sie später den Punkt identifizieren, an dem Sie Extraktions-, Transaktions- und Lade-Prozesse (ETL) erneut ausführen müssen, um nach dem Snapshot entstandene Daten in die Zieldatenbank zu laden.

  3. Stellen Sie den Snapshot in einem neuen Cluster wieder her. Dieser neue Cluster ist der Zielcluster. Prüfen Sie, ob sich die Beispieldaten im Zielcluster befinden.

  4. Passen Sie die Größe des Zielclusters an. Wählen Sie den Knotentyp, die Anzahl der Knoten und andere Einstellungen für den Zielcluster.

  5. Prüfen Sie die Ladungen aus Ihren ETL-Prozessen, die nach der Erstellung des Snapshots des Quellclusters aufgetreten sind. Achten Sie darauf, die Daten in der gleichen Reihenfolge erneut in den Zielcluster zu laden. Wenn Datenladevorgänge laufen, wiederholen Sie diesen Prozess mehrmals, bis die Daten im Quell- und Zielcluster identisch sind.

  6. Halten Sie alle laufenden Abfragen auf dem Quellcluster an. Hierzu können Sie den Cluster erneut starten oder sich als Superuser anmelden und die Befehle PG_CANCEL_BACKEND und PG_TERMINATE_BACKEND verwenden. Der Neustart des Clusters ist die einfachste Möglichkeit, um sicherzustellen, dass der Cluster nicht verfügbar ist.

  7. Benennen Sie den Quellcluster um. Beispielsweise von examplecluster zu examplecluster-source.

  8. Geben Sie dem Zielcluster den vorherigen Namen des Quellclusters. Benennen Sie beispielsweise den Zielcluster als examplecluster. Von diesem Punkt an verbinden sich alle Anwendungen, die den Endpunkt mit examplecluster verwenden, mit dem Zielcluster.

  9. Löschen Sie nach dem Wechsel zum Zielcluster den Quellcluster, und prüfen Sie, ob alle Prozesse wie erwartet ausgeführt werden.

Alternativ können Sie den Quell- und den Zielcluster umbenennen, bevor Sie Daten erneut in den Zielcluster laden. Dieser Ansatz funktioniert, wenn es nicht erforderlich ist, dass alle abhängigen Systeme und Berichte sofort denen des Zielclusters entsprechen. In diesem Fall wird Schritt 6 an das Ende des oben beschriebenen Prozesses verschoben.

Die Umbenennung ist nur erforderlich, wenn die Anwendungen weiterhin den selben Endpunkt für die Verbindung zum Cluster verwenden müssen. Wenn dies nicht erforderlich ist, können Sie stattdessen alle Anwendungen, die sich mit dem Cluster verbinden, so aktualisieren, dass sie den Endpunkt des Zielclusters verwenden, ohne den Cluster umzubenennen.

Die Wiederverwendung eines Clusternamens bietet eine Reihe von Vorteilen. Zunächst müssen Sie dann keine Anwendungsverbindungszeichenfolgen aktualisieren, da der Endpunkt gleich bleibt, obwohl sich der zugrunde liegende Cluster ändert. Zweitens sind zugehörige Elemente wie Amazon-CloudWatch-Alarme und Benachrichtigungen in Amazon Simple Notification Service (Amazon SNS) mit dem Clusternamen verknüpft. Durch diese Verknüpfung können Sie weiterhin die Alarme und Benachrichtigungen verwenden, die Sie für den Cluster eingerichtet haben. Diese fortgesetzte Verwendung ist besonders in Produktionsumgebungen relevant, in denen Sie die Flexibilität benötigen, die Größe des Clusters anzupassen, ohne zugehörige Elemente wie Alarme und Benachrichtigungen neu zu konfigurieren.

Details zum Ändern der Größe eines Clusters

Wenn Ihr Speicher bzw. die Leistung nach der ersten Bereitstellung Ihres Clusters geändert werden müssen, können Sie die Größe Ihres Clusters anpassen. Durch das Hinzufügen oder Entfernen von Knoten ist eine Ein- oder Ausskalierung möglich. Oder Sie skalieren ihn aufwärts oder abwärts durch Angeben eines anderen Knotentyps.

Sie können beispielsweise weitere Knoten hinzufügen, Knotentypen ändern, einen Einzelknoten-Cluster in einen Mehrfachknoten-Cluster ändern oder einen Mehrfachknoten-Cluster in einen Einzelknoten-Cluster umwandeln. Sie müssen jedoch sicherstellen, dass der resultierende Cluster groß genug ist, um mit den Daten umgehen zu können, die Sie derzeit haben; andernfalls schlägt die Größenanpassung fehl. Bei Verwendung der API müssen Sie den Knotentyp, die Knotengröße und die Anzahl der Knoten angeben, selbst wenn Sie nur eine der beiden Eigenschaften ändern.

Nachfolgend finden Sie eine Beschreibung des Prozesses der Größenanpassung:

  1. Wenn Sie den Größenanpassungsprozess initiieren, sendet Amazon Redshift eine Ereignisbenachrichtigung, die die Anfrage zur Größenanpassung bestätigt, und beginnt mit der Bereitstellung des neuen (Ziel-)Clusters.

  2. Wenn der neue (Ziel-)Cluster bereitgestellt ist, sendet Amazon Redshift eine Ereignisbenachrichtigung dazu, dass die Größenanpassung begonnen hat, und startet dann den vorhandenen (Quell-)Cluster im schreibgeschützten Modus. Durch den Neustart werden alle bestehenden Verbindungen zu dem Cluster beendet. All nicht bestätigten Transaktionen (einschließlich COPY) werden zurückgefahren. Während sich der Cluster im schreibgeschützten Modus befindet, können Sie Lese-Abfragen, aber keine Schreib-Abfragen ausführen.

  3. Amazon Redshift beginnt mit der Kopie der Daten vom Quellcluster zum Zielcluster.

  4. Wenn der Größenanpassungsprozess kurz vor dem Abschluss steht, aktualisiert Amazon Redshift den Endpunkt des Ziel-Clusters, und alle Verbindungen zum Quell-Cluster werden beendet.

  5. Nach Abschluss der Größenanpassung sendet Amazon Redshift eine Ereignisbenachrichtigung dazu, dass die Größenanpassung abgeschlossen wurde. Sie können dann eine Verbindung zum Zielcluster herstellen und Lese- und Schreib-Abfragen ausführen.

Wenn Sie die Größe Ihres Clusters anpassen, bleibt dieser bis zum Abschluss des Vorgangs im schreibgeschützten Modus. Sie können den Fortschritt der Größenanpassung auf der Amazon-Redshift-Konsole anzeigen. Die Zeit für die Größenanpassung eines Clusters hängt von der Datenmenge in jedem Knoten ab. Typischerweise dauert eine Größenanpassung zwischen einigen Stunden und einem Tag, obwohl bei größeren Datenmengen auch noch mehr Zeit benötigt werden kann. Der Grund dafür ist, dass die Daten parallel von jedem Knoten auf dem Quellcluster zu den Knoten im Zielcluster kopiert werden. Weitere Informationen zur Größenanpassung von Clustern finden Sie unter Größenanpassung eines Clusters.

Amazon Redshift führt während eines Größenanpassungsvorgangs keine Tabellensortierungen durch. Wenn Sie die Größe eines Clusters anpassen, verteilt Amazon Redshift die Datenbanktabellen auf der Grundlage Ihrer Verteilungsstile auf die neuen Datenverarbeitungsknoten und führt einen ANALYZE-Befehl aus, um die Statistik zu aktualisieren. Zur Löschung markierte Zeilen werden nicht übertragen, Sie müssen daher nur dann einen VACUUM-Befehl ausführen, wenn Ihre Tabellen neu sortiert werden müssen. Weitere Informationen finden Sie unter Bereinigen von Tabellen im Datenbankentwicklerhandbuch zu Amazon Redshift.

Wenn Ihr Cluster öffentlich ist und sich in einer VPC befindet, behält er nach der Größenänderung dieselbe Elastic IP-Adresse (EIP) für den Leader-Knoten. Wenn Ihr Cluster privat ist und sich in einer VPC befindet, behält er nach der Größenanpassung dieselbe private IP-Adresse für den Leader-Knoten. Wenn sich Ihr Cluster nicht in einer VPC befindet, wird im Rahmen der Größenanpassung für den Leader-Knoten eine neue öffentliche IP-Adresse zugewiesen.

Verwenden Sie zum Abruf der Knoten-IP-Adresse für einen Cluster das Dig-Utility, wie nachfolgend gezeigt:

dig mycluster.abcd1234.us-west-2.redshift.amazonaws.com

Die IP-Adresse des Führungsknotens befindet sich am Ende der ANSWER SECTION in den Ergebnissen, wie nachfolgend gezeigt:

Anhalten und Fortsetzen von Clustern

Wenn Sie über einen Cluster verfügen, der nur zu bestimmten Zeiten verfügbar sein muss, können Sie den Cluster anhalten und ihn später fortsetzen. Während der Cluster angehalten ist , wird die On-Demand-Abrechnung unterbrochen. Nur für den Speicher des Clusters fallen Gebühren an. Weitere Informationen zu Preisen finden Sie unter Amazon Redshift – Preise.

Wenn Sie einen Cluster anhalten, erstellt Amazon Redshift einen Snapshot, beendet Abfragen und versetzt den Cluster in einen Pause-Status. Wenn Sie einen angehaltenen Cluster löschen, ohne einen endgültigen Snapshot anzufordern, können Sie den Cluster nicht wiederherstellen. Sie können eine Pausierungs- oder Fortsetzungsoperation nicht mehr abbrechen oder zurücksetzen, nachdem sie gestartet wurde.

Sie können einen Cluster in der neuen Amazon-Redshift-Konsole, über die AWS CLI oder mit Amazon-Redshift-API-Operationen anhalten und fortsetzen.

Sie können Aktionen zum Anhalten und Fortsetzen eines Clusters planen. Wenn Sie die neue Amazon-Redshift-Konsole verwenden, um einen wiederkehrenden Zeitplan zum Anhalten und Fortsetzen zu erstellen, werden zwei geplante Aktionen für den ausgewählten Datumsbereich erstellt. Die Namen der geplanten Aktion werden mit -pause und -resume suffigiert. Die Gesamtlänge des Namens muss innerhalb der maximalen Größe eines geplanten Aktionsnamens liegen.

Die folgenden Clustertypen können nicht angehalten werden:

  • EC2-Classic-Cluster.

  • Cluster, die nicht aktiv sind, z. B. ein Cluster, der derzeit geändert wird.

  • HSM (Hardware Security Module-Cluster

  • Cluster, für die automatisierte Snapshots deaktiviert sind.

Berücksichtigen Sie bei der Entscheidung, einen Cluster anzuhalten, Folgendes:

  • Verbindungen oder Abfragen zum Cluster sind nicht verfügbar.

  • Die Informationen zur Abfrageüberwachung eines angehaltenen Clusters auf der Amazon-Redshift-Konsole können nicht angezeigt werden.

  • Sie können einen angehaltenen Cluster nicht ändern. Alle geplanten Aktionen auf dem Cluster werden nicht ausgeführt. Dazu gehören das Erstellen von Snapshots, die Größenanpassung von Clustern und Clusterwartungsoperationen.

  • Hardware-Metriken werden nicht erstellt. Aktualisieren Sie Ihre CloudWatch-Alarme, wenn für fehlende Metriken Alarme eingestellt sind.

  • Sie können die letzten automatisierten Snapshots eines angehaltenen Clusters nicht in manuelle Snapshots kopieren.

  • Wenn ein Cluster angehalten ist, kann er erst fortgesetzt werden, wenn die Pausierungsoperation abgeschlossen ist.

  • Wenn Sie einen Cluster anhalten, wird die Abrechnung unterbrochen. Die Pausierungsoperation wird jedoch in der Regel innerhalb von 15 Minuten abgeschlossen, je nach Größe des Clusters.

  • Prüfprotokolle werden archiviert und beim Fortsetzen nicht wiederhergestellt.

  • Tabellen ohne Backup im Cluster werden beim Fortsetzen nicht wiederhergestellt. Weitere Informationen zu Tabellen ohne Backup finden Sie unter Ausschluss von Tabellen von Snapshots.

Wenn Sie einen Cluster fortsetzen, sollten Sie Folgendes beachten:

  • Die Clusterversion des fortgesetzten Clusters wird basierend auf dem Wartungsfenster des Clusters auf die Wartungsversion aktualisiert.

  • Wenn Sie das Subnetz löschen, das einem angehaltenen Cluster zugeordnet ist, haben Sie möglicherweise ein inkompatibles Netzwerk. Stellen Sie in diesem Fall den Cluster aus dem neuesten Snapshot wieder her.

  • Wenn Sie eine Elastic IP-Adresse löschen, während der Cluster angehalten ist, wird eine neue Elastic IP-Adresse angefordert.

  • Wenn Amazon Redshift den Cluster mit seiner vorherigen Elastic-Network-Schnittstelle nicht fortsetzen kann, versucht Amazon Redshift, einen neuen zu reservieren.

  • Wenn Sie einen Cluster fortsetzen, können sich die IP-Adressen des Knotens ändern. Möglicherweise müssen Sie Ihre VPC-Einstellungen aktualisieren, um diese neuen IP-Adressen für Funktionen wie COPY from Secure Shell (SSH) oder COPY from Amazon EMR zu unterstützen.

  • Wenn Sie versuchen, einen Cluster fortzusetzen, der nicht angehalten ist, gibt die Fortsetzungsoperation einen Fehler zurück. Wenn die Fortsetzungsoperation Teil einer geplanten Aktion ist, ändern oder löschen Sie die geplante Aktion, um zukünftige Fehler zu vermeiden.

  • Je nach der Größe des Clusters kann es einige Minuten dauern, bis ein Cluster bei seiner Fortsetzung wieder Abfragen verarbeiten kann. Darüber hinaus kann die Abfrageleistung für einen gewissen Zeitraum beeinträchtigt sein, während der Cluster nach Abschluss der Fortsetzungsoperation erneut hydriert wird.

Umbenennen von Clustern

Sie können einen Cluster nach Wunsch umbenennen. Da der Endpunkt Ihres Clusters den Clusternamen (auch als Cluster-Kennung bezeichnet) enthält, verwendet der Endpunkt nach der Umbenennung den neuen Namen. Zum Beispiel: Wenn Sie einen Cluster mit der Bezeichnung examplecluster haben und diesen in newcluster umbenennen, verwendet der Endpunkt die ID newcluster. Alle mit dem Cluster verbundenen Anwendungen müssen mit dem neuen Endpunkt aktualisiert werden.

Sie können einen Cluster umbenennen, wenn Sie den Cluster ändern möchten, mit dem sich Ihre Anwendungen verbinden, ohne dass der Endpunkt in diesen Anwendungen geändert werden muss. In diesem Fall müssen Sie zuerst den ursprünglichen Cluster umbenennen und dann den zweiten Cluster ändern, damit dieser den Namen des ursprünglichen Clusters vor der Umbenennung verwendet. Dies ist erforderlich, da die Cluster-ID innerhalb Ihres Kontos und Ihrer Region eindeutig sein muss und der ursprüngliche und der zweite Cluster daher nicht denselben Namen haben dürfen. Sie können dies tun, wenn Sie einen Cluster aus einem Snapshot wiederherstellen und die Verbindungseigenschaften der davon abhängigen Anwendungen nicht ändern möchten.

Anmerkung

Wenn Sie den ursprünglichen Cluster löschen, sind Sie für die Löschung aller nicht benötigten Cluster-Snapshots verantwortlich.

Wenn Sie einen Cluster umbenennen, wechselt dessen Status bis zum Abschluss des Vorgangs zu renaming. Der alte von dem Cluster verwendete DNS-Name wird sofort gelöscht, kann aber noch einige Minuten im Zwischenspeicher aufbewahrt werden. Der neue DNS-Name für den umbenannten Cluster wird nach etwa 10 Minuten wirksam. Der umbenannte Cluster ist erst verfügbar, wenn der neue Name wirksam ist. Der Cluster wird neu gestartet, und alle bestehenden Verbindungen zu dem Cluster werden getrennt. Wenn dies abgeschlossen ist, verwendet der Endpunkt den neuen Namen. Daher sollten Sie alle laufenden Abfragen anhalten, bevor Sie die Umbenennung beginnen, und diese nach Abschluss des Vorgangs neu starten.

Cluster-Snapshots werden beibehalten, und alle mit einem Cluster verbundenen Snapshot sind dies auch nach Abschluss der Umbenennung. Nehmen Sie beispielsweise an, Sie haben einen Cluster für Ihre Produktionsdatenbank, für den mehrere Snapshots vorliegen. Wenn Sie den Cluster umbenennen und dann in der Produktionsumgebung durch einen Snapshot ersetzen, sind dem umbenannten Cluster nach wie vor diese vorhandenen Snapshots zugeordnet.

Amazon-CloudWatch-Alarme und Benachrichtigungen in Amazon Simple Notification Service (Amazon SNS) sind mit dem Clusternamen verknüpft. Wenn Sie den Cluster umbenennen, müssen Sie diese entsprechend aktualisieren. Sie können die CloudWatch-Alarme in der CloudWatch-Konsole und die Amazon-SNS-Ereignisbenachrichtigungen in der Amazon-Redshift-Konsole im Bereich Events (Ereignisse) aktualisieren. Die Lade- und Abfragedaten für den Cluster zeigen nach wie vor Daten von vor und von nach der Umbenennung an. Die Leistungsdaten werden jedoch nach der Umbenennung zurückgesetzt.

Weitere Informationen finden Sie unter Modifizieren eines Clusters.

Schließen und Löschen von Clustern

Sie können Ihren Cluster schließen, wenn er nicht weiter betrieben und Kosten verursachen soll. Wenn Sie dies tun, können Sie optional einen abschließenden Snapshot erstellen. Wenn Sie einen abschließenden Snapshot erstellen, erstellt Amazon Redshift einen manuellen Snapshot Ihres Clusters, bevor es ihn schließt. Sie können diesen Snapshot später wiederherstellen, wenn Sie die Ausführung des Clusters fortsetzen und Daten abfragen möchten.

Wenn Sie Ihren Cluster und dessen Daten nicht mehr benötigen, können Sie ihn schließen, ohne einen abschließenden Snapshot zu erstellen. In diesem Fall werden Cluster und Daten dauerhaft gelöscht. Für weitere Informationen zum Schließen und Löschen von Clustern vgl. Löschen eines Clusters.

Unabhängig davon, ob Sie Ihren Cluster mit einem abschließenden Snapshot schließen, werden alle mit dem Cluster verbundenen automatisierten Snapshots nach dem Schließen des Clusters gelöscht. Alle mit dem Cluster verbundenen manuellen Snapshots werden beibehalten. Alle beibehaltenen manuellen Snapshots, einschließlich des optionalen abschließenden Snapshots, unterliegen der Speichergebühr von Amazon Simple Storage Service, wenn Sie beim Schließen des Clusters keine weiteren aktiven Cluster haben oder wenn Sie den zur Ausführung Ihrer Amazon-Redshift-Cluster bereitgestellten kostenlosen Speicherplatz überschreiten. Weitere Informationen zu den Gebühren für die Speicherung von Snapshots finden Sie auf der Seite Amazon Redshift – Preise.