Arbeiten mit Amazon Redshift Serverless (Vorschau) - Amazon Redshift

Arbeiten mit Amazon Redshift Serverless (Vorschau)

Hierbei handelt es sich um die vorab veröffentlichte Dokumentation für Amazon Redshift Serverless, ein Service, dessen Vorversion verfügbar ist. Sowohl die Dokumentation als auch die Funktion können sich ändern. Wir empfehlen, diese Funktion nur in Test- und nicht in Produktionsumgebungen zu verwenden. Die Bedingungen für Vorversionen finden Sie unter Beta-Service-Teilnahme in den AWS-Servicebedingungen.

Wenn Sie Fragen zu dieser Vorschau haben, wenden Sie sich bitte per E-Mail an das Team von Amazon Redshift Serverless unter redshift-preview-serverless@amazon.com. Bei Serviceproblemen wenden Sie sich an AWS Support.

Amazon Redshift Serverless stellt automatisch Data-Warehouse-Kapazität bereit und skaliert die zugrunde liegenden Ressourcen intelligent. Der Serverless-Endpunkt passt die Kapazität in Sekunden an, um selbst für anspruchsvollste und dynamischste Workloads eine gleichbleibend hohe Leistung und vereinfachte Abläufe bereitzustellen.

Mit dem Serverless-Endpunkt können Sie von den folgenden Funktionen profitieren:

  • Greifen Sie auf Daten zu und analysieren Sie sie, ohne dass Sie von Amazon Redshift bereitgestellte Cluster einrichten, optimieren und verwalten müssen.

  • Nutzen Sie die überlegenen Amazon-Redshift-SQL-Funktionen, die branchenführende Leistung und die Lake-House-Architektur, um nahtlos ein Data Warehouse, einen Data Lake und betriebliche Datenquellen abzufragen.

  • Bieten Sie konstant hohe Leistung und vereinfachte Abläufe selbst für anspruchsvollste und dynamischste Workloads mit intelligenter und automatischer Skalierung in Sekundenschnelle.

  • Zahlen Sie nur, wenn das Data Warehouse verwendet wird.

Mit dem Serverless-Endpunkt greifen Sie über eine Konsolenschnittstelle auf ein Serverless-Data-Warehouse zu. Über das Data Warehouse können Sie auf Ihren von Amazon Redshift verwalteten Speicher und Ihren Amazon-S3-Data-Lake zugreifen.

In den folgenden Abschnitten erlernen Sie die Grundlagen von Amazon Redshift Serverless.

Erste Schritte mit Amazon Redshift Serverless

Um die Amazon-Redshift-Konsole verwenden zu können, benötigen Sie IAM-Berechtigungen wie unter Verwenden identitätsbasierter Richtlinien (IAM-Richtlinien) für Amazon Redshift im Amazon-Redshift-Clusterverwaltungshandbuch beschrieben. Um Amazon Redshift Serverless zu verwenden, fügen Sie Ihrer IAM-Rolle oder Ihrem IAM-Benutzer außerdem eine Richtlinie ähnlich der folgenden Richtlinie an.

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "redshift-serverless:*", "Resource": "*" } ] }

Um zu beginnen, öffnen Sie die AWS Management Console, wählen Sie die Amazon-Redshift-Konsole und dann Try Amazon Redshift Serverless (Amazon Redshift Serverless testen) aus.

Wenn Sie beim ersten Öffnen der Serverless-Endpunkt-Konsole über die richtigen AWS Identity and Access Management (IAM)-Berechtigungen verfügen, wird die Seite Get started with Amazon Redshift Serverless (Erste Schritte mit Amazon Redshift Serverless) angezeigt. Ihre Organisation ist möglicherweise für Serverless-Guthaben für Ihren Serverless-Endpunkt qualifiziert. Weitere Informationen finden Sie unter Kostenlose Testversion von Amazon Redshift.

Hier können Sie Standardeinstellungen verwenden oder Anpassen der Einstellungen auswählen, um Ihren Serverless-Endpunkt und eine Datenbank zu erstellen. Beim Anpassen werden folgenden Einstellungen für Ihre Umgebung angezeigt:

  • Database name (Datenbankname) – Der Name der anfänglichen Datenbank (Standard), die in der Serverless-Endpunktumgebung erstellt werden soll. Diese Datenbank gehört Ihrem Konto und wird in der aktuellen AWS-Region erstellt. Der Name lautet dev und kann nicht geändert werden.

  • Admin user credentials (Administrator-Anmeldeinformationen) – Der Benutzername und das Passwort des Administrators der Ausgangsdatenbank. Dieser Benutzer hat Eigentumsberechtigungen für die Datenbank. Weitere Informationen finden Sie unter Identity and Access Management in Amazon Redshift Serverless.

  • Virtual Private Cloud (VPC) – Der Name der VPC, in der die Datenbank erstellt wird.

  • VPC security groups (VPC-Sicherheitsgruppen) – Diese Sicherheitsgruppen definieren, welche Subnetze und IP-Bereiche in der VPC verwendet werden können.

  • Subnet (Subnetz) – Die Subnetze in der VPC, die der angegebenen Datenbank zugeordnet ist. Aktuelle Überlegungen bei der Auswahl des Subnetzes finden Sie unter Bekannte Probleme und Einschränkungen.

  • Der KMS-Schlüssel im Besitz von AWS wird standardmäßig zur Verschlüsselung Ihrer Daten verwendet. Anstatt den KMS-Schlüssel im Besitz von AWS zu verwenden, können Sie mit Customize encryption settings (Verschlüsselungseinstellungen anpassen) einen von Ihnen verwalteten KMS-Schlüssel auswählen. Der AWS KMS key wird zur Verschlüsselung von Ressourcen auf dem Serverless-Endpunkt verwendet. Informationen zum Erstellen von KMS-Schlüsseln finden Sie unter Erstellen von Schlüsseln im AWS Key Management Service-Entwicklerhandbuch.

  • Audit logging (Prüfungsprotokollierung) – Die Arten von Prüfungsprotokollen, die Sie exportieren möchten. Weitere Informationen finden Sie unter Prüfungsprotokollierung für Amazon Redshift Serverless.

  • Permissions (Berechtigungen) – Die IAM-Rolle, die Sie Ihrem Serverless-Endpunkt zuordnen, muss eine Vertrauensbeziehung mit redshift-serverless.amazonaws.com und redshift.amazonaws.com aufweisen. Informationen zum Erstellen dieser IAM-Rolle finden Sie unter Erforderliche Berechtigungen zur Verwendung von Amazon Redshift Serverless.

Amazon Redshift Serverless initialisiert die Ressourcen für Ihr AWS-Konto in der aktuellen AWS-Region. Die Initialisierung zur Einrichtung der Umgebung kann einige Minuten dauern. Der Amazon-Redshift-Abfrage-Editor v2 wird auf einer neuen Registerkarte geöffnet, damit Sie Ihren Serverless-Endpunkt verwenden können.

Konsole von Amazon Redshift Serverless

Das Navigationsmenü der Konsole von Amazon Redshift Serverless enthält die folgenden Seiten und Links:

  • Serverless Dashboard – Zeigt eine Zusammenfassung Ihrer Ressourcen und Aktivitäten an.

  • Query editor (Abfrage-Editor) – Link zum Amazon-Redshift-Abfrage-Editor v2, um die Daten in Ihrem Serverless-Endpunkt zu verwalten und abzufragen. Der Abfrage-Editor v2 ist ein SQL-Client, in dem Sie Abfragen ausführen und Datenbanken erstellen und laden können.

  • Serverless configuration (Serverless-Konfiguration) – Zum Aktualisieren der Einstellungen Ihres Serverless-Endpunkts.

  • Query and database monitoring (Abfrage- und Datenbanküberwachung) – Zum Überprüfen und Analysieren Ihrer Abfrageaktivität.

  • Resource monitoring (Ressourcenüberwachung) – Zur Überprüfung Ihrer Kapazität und Computing-Nutzung.

  • Datashares – Zur Verwaltung der Datenfreigabe auf Kontoebene. Auf dieser Seite können Sie die Datashares verwalten, die für den Serverless-Endpunkt verfügbar sind. Weitere Informationen finden Sie unter Datenfreigabe in Amazon Redshift Serverless.

  • Provisioned clusters dashboard (Dashboard für bereitgestellte Cluster) – Zusammenfassung Ihrer bereitgestellten Cluster und zum Öffnen der Amazon-Redshift-Konsole.

  • Documentation (Dokumentation) – Link zur Startseite der Dokumentation.

Auf der Seite Serverless Dashboard finden Sie eine Zusammenfassung Ihrer Ressourcen und eine grafische Darstellung Ihrer Nutzung.

  • Resource summary (Ressourcen-Übersicht) – Dieser Abschnitt zeigt die Anzahl der Datenbanken und Snapshots auf Ihrem Serverless-Endpunkt.

  • Query summary (Abfragezusammenfassung) – Dieser Abschnitt zeigt die Abfrageaktivität für die letzte Stunde.

  • RPU capacity used (Genutzte RPU-Kapazität) – Dieser Abschnitt zeigt die in der letzten Stunde genutzte Kapazität an.

  • Datashares – Dieser Abschnitt zeigt die Anzahl der Datashares in diesem Konto oder von einem anderen Konto, die verfügbar sind oder autorisiert werden müssen.

Auf der Seite Serverless-Konfiguration finden Sie die Einstellungen für Ihre Serverless-Endpunktumgebung. Auf dieser Seite finden Sie Informationen zu den Einstellungen Ihrer Serverless-Endpunkte wie General information (Allgemeine Informationen), Data backup (Datensicherung), Data access (Datenzugriff) und Limits.

Im Abschnitt General information (Allgemeine Informationen) wird Folgendes angezeigt:

  • Serverless Namespace – Eine ID Ihres Serverless-Endpunkts.

  • Date created (Erstellungsdatum) – Das Datum und die Uhrzeit der Erstellung Ihres Serverless-Endpunkts.

  • Status – Ihr Serverless-Endpunkt muss Available sein, um einige Konfigurationseinstellungen abzufragen oder zu ändern.

  • Change admin password (Administratorpasswort ändern) – Sie können das Passwort des Administratorbenutzers ändern.

  • Database name (Datenbankname) – Der Name der ursprünglichen Datenbank, die mit dem Serverless-Endpunkt erstellt wurde. Dieser Name kann in der Verbindungszeichenfolge verwendet werden, wenn Sie eine Verbindung zum Serverless-Endpunkt herstellen.

  • Serverless credit remaining (Verbleibendes Serverless-Guthaben) – Das verbleibende Guthaben des Kontos.

  • Endpoint (Endpunkt) – Der Serverless-Endpunkt für einige Verbindungen.

  • JDBC-URL – Die Verbindungszeichenfolge für JDBC-Tools.

  • ODBC-URL – Die Verbindungszeichenfolge für ODBC-Tools.

Auf der Registerkarte Data backup (Datensicherung) finden Sie folgende Optionen:

  • Snapshots – Sie können Snapshots Ihrer Serverless-Endpunktdaten erstellen, löschen und verwalten. Derzeit beträgt der Aufbewahrungszeitraum für Snapshots indefinitely. Sie können AWS-Konten für Serverless autorisieren, Wiederherstellungen mit einem bestimmten Snapshot durchzuführen.

  • Recovery points (Wiederherstellungspunkte) – Zeigt automatisch erstellte Wiederherstellungspunkte an, die eine Wiederherstellung nach versehentlichem Überschreiben oder Löschen innerhalb der letzten 24 Stunden ermöglichen. Sie können einen Snapshot von einem Wiederherstellungspunkt aus erstellen, wenn Sie einen Wiederherstellungspunkt für einen längeren Zeitraum beibehalten möchten. Derzeit beträgt der Aufbewahrungszeitraum für Snapshots indefinitely.

Auf der Registerkarte Data access (Datenzugriff) finden Sie folgende Optionen:

  • Einstellungen Network and security (Netzwerk und Sicherheit) – Anzeigen von VPC-bezogenen Werten, den AWS KMS-Verschlüsselungswerten und den Werten der Prüfungsprotokollierung. Es können nur Werte für die Prüfungsprotokollierung aktualisiert werden.

  • AWS KMS key – Der AWS KMS key zur Verschlüsselung von Ressourcen auf dem Serverless-Endpunkt.

  • Permissions (Berechtigungen) – Sie können die IAM-Rollen verwalten, die Amazon Redshift Serverless für die Verwendung von Ressourcen in Ihrem Namen annehmen kann.

  • Redshift-managed VPC endpoints (Von RedShift verwaltete VPC-Endpunkte) – Sie können von einer anderen VPC oder einem anderen Subnetz aus auf Ihren Serverless-Endpunkt zugreifen.

Auf der Registerkarte Limits finden Sie folgende Optionen:

  • Einstellungen für die Base capacity in Redshift processing units (RPUs) (Basiskapazität an Redshift Processing Units (RPUs)) – Sie können die Basiskapazität festlegen, die zur Verarbeitung Ihrer Workload verwendet wird. Um die Abfrageleistung zu verbessern, erhöhen Sie den RPU-Wert.

  • Usage limits (Nutzungslimits) – Die maximalen Rechenressourcen, die Ihr Serverless-Endpunkt in einem Zeitraum verwenden kann, bevor eine Aktion gestartet wird. Sie begrenzen die Menge an Ressourcen, die Ihr Serverless-Endpunkt zum Ausführen Ihrer Workload verwendet. Die Nutzung ergibt sich aus der Zeit in Sekunden, in der Redshift Processing Units (RPUs) verwendet werden. Eine RPU-Sekunde ist die Anzahl der RPUs, die in einer Sekunde verwendet werden. Sie können folgende Aktionen festlegen, die beim Erreichen eines eingestellten Grenzwerts ausgeführt werden sollen:

    • Senden einer Warnung.

    • Protokollieren eines Eintrags in einer Systemtabelle.

    • Deaktivieren von Benutzerabfragen.

Weitere Informationen finden Sie unter Automatische Kapazitätsskalierung mit Basis- und Maximalparametern.

Auf der Registerkarte Datashares finden Sie folgende Optionen:

  • Einstellungen für Datashares created in my namespace (In meinem Namespace erstellte Datashares) – Sie können ein Datashare erstellen und für andere Namespaces und AWS-Konten freigeben.

  • Datashares from other namespaces and AWS-Konten (Datashares aus anderen Namespaces und AWS-Konten) – Sie können eine Datenbank aus einem Datashare aus einem anderen Namespace und AWS-Konten erstellen.

Auf der Seite Query and database monitoring (Abfrage- und Datenbanküberwachung) finden Sie Diagramme zu Query history (Abfrageverlauf) und Database performance (Datenbankleistung). Sie können die Daten nach mehreren Kriterien filtern.

Auf der Registerkarte Query history (Abfrageverlauf) finden Sie folgende Diagramme (Sie können zwischen Query list (Abfrageliste) und Resource metrics (Ressourcenmetriken) wählen):

  • Query runtime (Abfrage-Laufzeit) – Dieses Diagramm zeigt, welche Abfragen im selben Zeitrahmen ausgeführt werden. Wählen Sie einen Balken im Diagramm aus, um weitere Details zur Abfrageausführung anzuzeigen.

  • Queries and loads (Abfragen und Ladevorgänge) – In diesem Abschnitt werden Abfragen und Ladevorgänge nach Query ID (Abfrage-ID) aufgeführt.

  • RPU capacity used (Genutzte RPU-Kapazität) – Dieses Diagramm zeigt die Gesamtkapazität in Redshift Processing Units (RPUs) an.

  • Database connections (Datenbankverbindungen) – Dieses Diagramm zeigt die Anzahl der aktiven Datenbankverbindungen an.

Auf der Registerkarte Database Performance (Datenbankleistung) sehen Sie die folgenden Diagramme:

  • Queries completed per second (Ausgeführte Abfragen pro Sekunde) – Dieses Diagramm zeigt die durchschnittliche Anzahl der ausgeführten Abfragen pro Sekunde.

  • Query duration (Abfragedauer) – Dieses Diagramm zeigt die durchschnittliche Zeit zur Ausführung einer Abfrage.

  • Database connections (Datenbankverbindungen) – Dieses Diagramm zeigt die Anzahl der aktiven Datenbankverbindungen an.

  • Running queries (Laufende Abfragen) – Dieses Diagramm zeigt die Gesamtzahl der laufenden Abfragen zu einem bestimmten Zeitpunkt.

  • Queued queries (Abfragen in der Warteschlange) – Dieses Diagramm zeigt die Gesamtzahl der Abfragen in der Warteschlange zu einem bestimmten Zeitpunkt.

  • Query run time breakdown (Aufschlüsselung der Laufzeit von Abfragen) – Dieses Diagramm zeigt die Gesamtzeit der ausgeführten Abfragen nach Typ aufgeschlüsselt an.

Auf der Seite Resource monitoring (Ressourcenüberwachung) finden Sie Diagramme zu Ihren genutzten Ressourcen. Sie können die Daten nach mehreren Gesichtspunkten filtern.

  • RPU capacity used (Genutzte RPU-Kapazität) – Dieses Diagramm zeigt die Gesamtkapazität in Redshift Processing Units (RPUs) an.

  • Compute usage (Computing-Nutzung) – Dieses Diagramm zeigt die kumulative Nutzung von Amazon Redshift Serverless nach Zeitraum für den ausgewählten Zeitrahmen.

Auf der Seite Datashares können Sie Datashares unter In my account (In meinem Konto) und From other accounts (Aus anderen Konten) verwalten. Weitere Informationen zur Datenfreigabe finden Sie unter Datenfreigabe in Amazon Redshift Serverless.

Erforderliche Berechtigungen zur Verwendung von Amazon Redshift Serverless

Wenn Sie Amazon Redshift Serverless verwenden, benötigt die IAM-Rolle, die Sie Ihrem Serverless-Endpunkt zuordnen, eine Vertrauensbeziehung mit redshift.amazonaws.com und redshift-serverless.amazonaws.com, damit Amazon Redshift Berechtigungen in Ihrem Namen übernehmen kann.

Das folgende Beispiel zeigt das Richtliniendokument im JSON-Format zum Einrichten einer Vertrauensstellung mit Amazon Redshift Serverless.

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "redshift-serverless.amazonaws.com", "redshift.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

Weitere Informationen zu vertrauenswürdigen Entitäten finden Sie unter Erstellen einer Rolle zum Delegieren von Berechtigungen an einen AWS-Service im IAM-Benutzerhandbuch.

Übersicht über die Funktionen von Amazon Redshift Serverless

Die meisten Funktionen, die von einem von Amazon Redshift bereitgestellten Cluster unterstützt werden, werden auch auf einem Serverless-Endpunkt unterstützt. Im Folgenden werden einige der wichtigsten Funktionen von Amazon Redshift aufgeführt, die Sie mit einem Serverless-Endpunkt verwenden können.

  • Snapshots – Sie können einen Snapshot eines Serverless-Endpunkts oder eines bereitgestellten Clusters auf Ihrem Serverless-Endpunkt wiederherstellen. Weitere Informationen finden Sie unter Arbeiten mit Snapshots und Wiederherstellungspunkten.

  • Wiederherstellungspunkte – Amazon Redshift Serverless erstellt automatisch alle 30 Minuten einen Wiederherstellungspunkt. Diese Wiederherstellungspunkte werden 24 Stunden lang gespeichert. Sie können sie verwenden, um Ihren Serverless-Endpunkt nach versehentlichem Überschreiben oder Löschen wiederherzustellen. Wenn Sie von einem Wiederherstellungspunkt aus wiederherstellen, werden alle Daten in den Datenbanken Ihres Serverless-Endpunkts zu einem früheren Zeitpunkt wiederhergestellt. Sie können einen Snapshot auch von einem Wiederherstellungspunkt aus erstellen, wenn Sie einen Wiederherstellungspunkt für einen längeren Zeitraum beibehalten müssen. Weitere Informationen finden Sie unter Arbeiten mit Snapshots und Wiederherstellungspunkten.

  • RPU-Basiskapazität – Sie können eine Basiskapazität in Redshift Processing Units (RPUs) festlegen. Ein RPU bietet 2 vCPUs und 16 GiB Arbeitsspeicher. Amazon Redshift verwendet diese Messung, um die Ressourcen (also Kosten) zu begrenzen, die für Ihre Workload verwendet werden. Sie können diesen Wert erhöhen, um die Abfrageleistung zu steigern. Der Standardwert beträgt 128 RPUs.

  • Nutzungslimits der regionsübergreifenden Datenfreigabe – Sie können einschränken, wie viele Daten von einer Erzeugerregion an eine Verbraucherregion übertragen werden. Die Kosten für Datenübertragungen unterscheiden sich je nach AWS-Region.

  • Benutzerdefinierte Funktionen (User-defined functions, UDFs) – Sie können benutzerdefinierte Funktionen (UDFs) auf Ihrem Serverless-Endpunkt ausführen. Weitere Informationen finden Sie unter Erstellen von benutzerdefinierten Funktionen im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Gespeicherte Prozeduren – Sie können gespeicherte Prozeduren auf Ihrem Serverless-Endpunkt ausführen. Weitere Informationen finden Sie unter Erstellen von gespeicherten Prozeduren im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Materialisierte Ansichten – Auf Ihrem Serverless-Endpunkt können Sie materialisierte Ansichten erstellen. Weitere Informationen finden Sie unter Erstellen von materialisierten Ansichten im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Geofunktionen – Sie können Geofunktionen auf Ihrem Serverless-Endpunkt ausführen. Weitere Informationen finden Sie unter Abfrage von Geodaten im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Verbundabfragen – Sie können Abfragen ausführen, um Daten von Ihrem Serverless-Endpunkt aus mit Aurora- und Amazon-RDS-Datenbanken zu verbinden. Weitere Informationen finden Sie unter Abfragen von Daten mit Verbundabfragen im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Data-Lake-Abfragen – Sie können Abfragen ausführen, um Daten mit Ihrem Amazon-S3-Data-Lake mit Ihrem Serverless-Endpunkt zu verbinden.

  • HyperLogLog – Sie können HyperLogLog-Funktionen auf Ihrem Serverless-Endpunkt ausführen. Weitere Informationen finden Sie unter Verwenden von HyperLogLog-Skizzen im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Datenbankübergreifendes Abfragen von Daten – Sie können Daten datenbankübergreifend auf Ihrem Serverless-Endpunkt abfragen. Weitere Informationen finden Sie unter Datenbankübergreifendes Abfragen von Daten im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Freigabe von Daten – Sie können mit Ihrem Serverless-Endpunkt auf Datashares in bereitgestellten Clustern zugreifen. Weitere Informationen finden Sie unter Dateifreigabe in Clustern im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Abfragen von halbstrukturierten Daten – Sie können halbstrukturierte Daten mit dem Datentyp SUPER auf Ihrem Serverless-Endpunkt erfassen und speichern. Weitere Informationen finden Sie unter Erfassen und Abfragen von halbstrukturierten Daten im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • Amazon-Redshift-Machine-Learning – Sie können Amazon-Redshift-Machine-Learning mit Ihrem Serverless-Endpunkt verwenden. Weitere Informationen finden Sie unter Verwenden von Machine Learning im Datenbankentwicklerhandbuch zu Amazon Redshift.

  • SQL-Befehle und -Funktionen – mit wenigen Ausnahmen (wie REBOOT_CLUSTER) können Sie Amazon-Redshift-SQL-Befehle und -Funktionen auf Ihrem Serverless-Endpunkt verwenden. Weitere Informationen finden Sie in der SQL-Referenz im Datenbankentwicklerhandbuch zu Amazon Redshift.

Einige Funktionen, die von einem von Amazon Redshift bereitgestellten Cluster unterstützt werden, werden von Serverless-Endpunkten nicht unterstützt. Im Folgenden sind einige dieser Funktionen aufgeführt:

  • Amazon Redshift Spectrum

  • Parametergruppen

  • Workload-Management

  • Integration mit einem AWS-Partner

  • Wartungsfenster und Softwareversions-Tracks

Bekannte Probleme und Einschränkungen

Die folgenden Probleme sind offen:

  • Nach einer langen Inaktivität mit dem Amazon-Redshift-Abfrage-Editor v2 kann beim Ausführen einer Abfrage ein Ladesymbol angezeigt werden, ohne dass ein Abfrageergebnisbereich angezeigt wird. Durch das Aktualisieren des Webbrowsers kann dieser Zustand behoben werden.

  • Das Abbrechen mehrerer Abfragen im Abfrage-Editor v2 kann dazu führen, dass ein Ladesymbol angezeigt wird. Durch das Aktualisieren des Webbrowsers kann dieser Zustand behoben werden.

  • Ein Serverless-Endpunkt wird in den Availability Zones nur mit diesen IDs unterstützt:

    • use1-az2

    • use1-az4

    • use1-az6

    • use2-az1

    • use2-az2

    Wenn Sie Ihren Serverless-Endpunkt konfigurieren, öffnen Sie Weitere Überlegungen und stellen Sie sicher, dass die Subnetz-IDs unter Subnet (Subnetz) mindestens eine der unterstützten Availability-Zone-IDs enthalten. Um die Zuordnung von Subnetzen und Availability-Zone-IDs anzuzeigen, öffnen Sie die VPC-Konsole und wählen Sie Subnets (Subnetze) aus, um die Liste der Subnetz-IDs mit ihren Availability-Zone-IDs anzuzeigen. Stellen Sie sicher, dass Ihr Subnetz einer unterstützten Availability-Zone-ID zugeordnet ist. Weitere Informationen zum Erstellen von Subnetzen finden Sie unter Erstellen eines Subnetzes in der VPC im Amazon-VPC-Benutzerhandbuch.

  • Sie können jeweils nur einen Serverless-Endpunkt pro AWS-Konto haben.

  • Öffentliche Endpunkte werden nicht unterstützt.

  • Bei Amazon Redshift Serverless gibt es kein Wartungsfenster. Softwareversionen werden automatisch aktualisiert. Alle laufenden Verbindungen werden zum Zeitpunkt der Umstellung der Amazon-Redshift-Version unterbrochen. Kunden müssen Verbindungen wiederherstellen und Amazon Redshift Serverless funktioniert sofort.

Arbeiten mit dem Amazon-Redshift-Abfrage-Editor v2 und dem Serverless-Endpunkt

Sie können Ihre Datenbanken mit dem Abfrage-Editor v2 verwalten und abfragen. Der Abfrage-Editor v2 ist ein webbasiertes SQL-Client-Tool mit vollem Funktionsumfang zur Verbindung mit Ihren Amazon-Redshift-Daten. Informationen zur Verwendung des Amazon-Redshift-Abfrage-Editors v2, einschließlich der erforderlichen Berechtigungen, finden Sie unter Konfigurieren Ihres AWS-Konto im Amazon-Redshift-Clusterverwaltungshandbuch.

Über die Schaltfläche Query data (Daten abfragen) können Sie Daten mit dem Abfrage-Editor v2 auf Ihrem Serverless-Endpunkt abfragen. Wenn Sie den Abfrage-Editor v2 über die Amazon-Redshift-Serverless-Konsole aufrufen, wird er in einer neuen Browser-Registerkarte geöffnet. Der Abfrage-Editor v2 stellt eine Verbindung von Ihrem Clientcomputer mit der Serverless-Endpunktumgebung her. Sie können alle Amazon-Redshift-SQL-Funktionen mit Amazon Redshift Serverless verwenden, einschließlich Unterstützung für halbstrukturierte Daten, Datenfreigabe, Machine-Learning-Funktionen für einen Amazon-S3-Data-Lake und Verbundabfragen. Mit dem Abfrage-Editor v2 können Sie die folgenden Aufgaben ausführen:

  • Abfragen von Daten auf Ihren Serverless- und bereitgestellten Clustern.

  • Hochladen von Beispieldaten in die Datenbank sample_data_dev.

  • Erstellen von Datenbanken, Schemata, Tabellen und Funktionen.

  • Speichern und Teilen von Abfragen.

  • Speichern von Diagrammen.

Weitere Informationen zur Arbeit mit dem Abfrage-Editor finden Sie unter Abfragen einer Datenbank mit dem Abfrage-Editor v2 von Amazon Redshift im Amazon-Redshift-Clusterverwaltungshandbuch.

Herstellen einer Verbindung mit dem Serverless-Endpunkt

Amazon Redshift Serverless bietet einen Serverless-Endpunkt für Ihr AWS-Konto. Wenn Sie mehrere Teams oder Projekte haben und die Kosten separat verwalten möchten, können Sie separate AWS-Konten verwenden.

Der Serverless-Endpunkt stellt eine Verbindung zur Serverless-Umgebung in Ihrem AWS-Konto in der aktuellen AWS-Region her. Der Serverless-Endpunkt wird in einer VPC ausgeführt und ist nicht öffentlich zugänglich.

Sie können eine Verbindung mit einer Datenbank (mit dem Namen dev) auf dem Endpunkt mit der folgenden Syntax herstellen.

account-number.aws-region.redshift-serverless.amazonaws.com:port/dev

Die folgende Verbindungszeichenfolge gibt beispielsweise die Region us-east-1 an.

123456789012.us-east-1.redshift-serverless.amazonaws.com:5439/dev

Sie können eine der folgenden Methoden verwenden, um mit dem von Amazon RedShift bereitgestellten JDBC-Treiber Version 2 eine Verbindung zu Ihrem Serverless-Endpunkt mit Ihrem bevorzugten SQL-Client herzustellen.

Verwenden Sie die folgende Syntax, um eine Verbindung mit IAM über den JDBC-Treiber Version 2.x herzustellen.

jdbc:redshift:iam://redshift-serverless-default:aws-region/dev

Die folgende Verbindungszeichenfolge gibt beispielsweise die Region us-east-1 an.

jdbc:redshift:iam://redshift-serverless-workspace:us-east-1/dev

Verwenden Sie die folgende Syntax, um eine Verbindung mit einem Benutzernamen und einem Passwort für die Datenbankauthentifizierung mit dem JDBC-Treiber Version 2.0 oder höher herzustellen.

jdbc:redshift://account-number.aws-region.redshift-serverless.amazonaws.com:5439/dev

Die folgende Verbindungszeichenfolge gibt beispielsweise die Konto-ID 123456789012 in der Region us-east-2 an.

jdbc:redshift://123456789012.us-east-2.redshift-serverless.amazonaws.com:5439/dev

Um eine Verbindung mit IAM über den JDBC-Treiber Version 2.1.0.3 herzustellen, der auf Anfrage während des Vorschauzeitraums verfügbar ist, verwenden Sie die folgende Syntax.

jdbc:redshift:iam://account-number.aws-region.redshift-serverless.amazonaws.com:5439/dev

Die folgende Verbindungszeichenfolge gibt beispielsweise die Konto-ID 123456789012 in der Region us-east-2 an.

jdbc:redshift:iam://123456789012.us-east-2.redshift-serverless.amazonaws.com:5439/dev

Weitere Informationen zu Treibern finden Sie unter Konfigurieren von Verbindungen im Amazon-Redshift-Clusterverwaltungshandbuch.

Amazon Redshift Serverless ist in folgenden AWS-Regionen verfügbar:

  • Region USA Ost (Nord-Virginia) (us-east-1)

  • Region USA Ost (Ohio) (us-east-2)

  • Region USA West (Oregon) (us-west-2)

  • Region Europa (Irland) (eu-west-2)

  • Region Europa (Frankfurt) (eu-central-1)

  • Region Asien-Pazifik (Tokio) (ap-northeast-1)

Herstellen einer Verbindung mit dem Serverless-Endpunkt über die Data API

Sie können die Amazon Redshift Data API auch verwenden, um eine Verbindung mit dem Serverless-Endpunkt herzustellen. Lassen Sie den Parameter cluster-identifier in Ihren AWS CLI-Aufrufen deaktiviert, damit Ihre Abfrage an den Serverless-Endpunkt geleitet wird.

Im folgenden Beispiel wird eine SQL-Anweisung ausgeführt, um Daten vom Serverless-Endpunkt abzurufen. In diesem Beispiel wird die Authentifizierungsmethode mit temporären Anmeldeinformationen verwendet.

aws redshift-data execute-statement --sql "select 1;" --database dev
{ "CreatedAt": 1636062665.587, "Database": "dev", "Id": "ad30c9a1-be92-4534-9edf-7d9aea4ea6a3" }

Im folgenden Beispiel wird eine SQL-Anweisung beschrieben, die an den Serverless-Endpunkt übermittelt wurde.

aws redshift-data describe-statement --id 1d222b16-6470-467f-a1f8-7f38103dab11
{ "CreatedAt": 1636064662.659, "Duration": 4358742, "HasResultSet": true, "Id": "1d222b16-6470-467f-a1f8-7f38103dab11", "QueryString": "select 1;", "RedshiftPid": 1073881246, "RedshiftQueryId": 0, "ResultRows": 1, "ResultSize": 11, "Status": "FINISHED", "UpdatedAt": 1636064663.324

Im folgenden Beispiel werden die Ergebnisse einer SQL-Anweisung abgerufen, die auf einem Serverless-Endpunkt ausgeführt wurde.

aws redshift-data get-statement-result --id 1d222b16-6470-467f-a1f8-7f38103dab11
{ "Records": [ [ { "longValue": 1 } ] ], "ColumnMetadata": [ { "isCaseSensitive": false, "isCurrency": false, "isSigned": true, "label": "?column?", "length": 0, "name": "?column?", "nullable": 1, "precision": 10, "scale": 0, "schemaName": "", "tableName": "", "typeName": "int4" } ], "TotalNumRows": 1 }

Im folgenden Beispiel wird eine SQL-Anweisung ausgeführt, um Daten vom Serverless-Endpunkt abzurufen. In diesem Beispiel wird die AWS Secrets Manager-Authentifizierungsmethode verwendet.

Erstellen Sie zunächst ein Secret in AWS Secrets Manager.

aws secretsmanager create-secret --name serverless-test --secret-string '{ "password": "Testing12345", "engine": "redshift", "host": "123456789012.us-east-1.redshift-serverless-dev.amazonaws.com", "port": 5439, "username": "testUser" }'
{ "ARN": "arn:aws:secretsmanager:us-east-1:123456789012:secret:serverless-test-YY3nMG", "Name": "serverless-test", "VersionId": "961a01eb-a30f-4d56-ab05-3708fd60d728" }

Führen Sie dann eine SQL-Anweisung aus, die das Secret zur Authentifizierung verwendet.

aws redshift-data execute-statement --sql "select * from sys_query_history;" --database dev --secret-arn arn:aws:secretsmanager:us-east-1:123456789012:secret:serverless-test-YY3nMG
{ "CreatedAt": 1635990593.75, "Database": "dev", "Id": "56662da2-5691-4a8d-b1c1-cb73f577f08d", "SecretArn": "arn:aws:secretsmanager:us-east-1:123456789012:secret:serverless-test-YY3nMG" }

Sie können auch eine Beschreibung einer SQL-Anweisung ausführen, um das zugehörige Secret anzuzeigen.

aws redshift-data describe-statement --id 56662da2-5691-4a8d-b1c1-cb73f577f08d
{ "CreatedAt": 1635990593.75, "Duration": 632754750, "HasResultSet": true, "Id": "56662da2-5691-4a8d-b1c1-cb73f577f08d", "QueryString": "select * from sys_query_history;", "RedshiftPid": 1073963329, "RedshiftQueryId": 100880, "ResultRows": 7, "ResultSize": 4170, "SecretArn": "arn:aws:secretsmanager:us-east-1:123456789012:secret:serverless-test-YY3nMG", "Status": "FINISHED", "UpdatedAt": 1635990595.083 }

Weitere Informationen über die Data API finden Sie unter Verwenden der Amazon Redshift Data API im Amazon-Redshift-Clusterverwaltungshandbuch.

Herstellen einer SSL-Verbindung mit dem Serverless-Endpunkt

Konfigurieren einer sicheren Verbindung zu Amazon Redshift Serverless

Amazon Redshift unterstützt Secure Sockets Layer (SSL)-Verbindungen zum Verschlüsseln von Abfragen und Daten. Um eine sichere Verbindung einzurichten, können Sie dieselbe Konfiguration verwenden, mit der Sie eine Verbindung zu einem bereitgestellten Redshift-Cluster einrichten. Folgen Sie den Schritten unter Konfigurieren von Sicherheitsoptionen für Verbindungen, die beschreiben, wie das verfügbare SSL-Zertifikat-Paket heruntergeladen und installiert wird. Das Paket funktioniert für eine Verbindung mit einer Serverless-Redshift-Instanz und einem bereitgestellten Cluster.

Datenfreigabe in Amazon Redshift Serverless

Verwenden Sie die Datenfreigabe, um aktuelle und konsistente Informationen bei ihrer Aktualisierung auf einem Serverless-Endpunkt weiterzugeben.

Datenfreigabe in Amazon Redshift Serverless

Mit der Datenfreigabe haben Sie Live-Zugriff auf Daten, damit Ihre Benutzer die aktuellsten und konsistentesten Informationen sehen können, wenn sie auf einen Serverless-Endpunkt aktualisiert werden.

Erste Schritte mit der Datenfreigabe in Amazon Redshift Serverless

Sie können Daten für Lesezwecke auf verschiedenen Amazon-Redshift-Serverless-Endpunkten eines oder mehrerer AWS-Konten freigeben.

Sie können mit der Datenfreigabe beginnen, indem Sie entweder die SQL-Schnittstelle oder die Amazon-Redshift-Konsole verwenden. Weitere Informationen finden Sie unter Erste Schritte mit der Datenfreigabe über die SQL-Schnittstelle oder Erste Schritte bei der Datenfreigabe mit der Konsole im Datenbankentwicklerhandbuch zu bAmazon Redshift.

In einem AWS-Konto können Sie Daten für Lesezwecke von einem bereitgestellten Cluster für einen Serverless-Endpunkt oder von einem Serverless-Endpunkt für einen bereitgestellten Cluster freigeben. Weitere Informationen zur Datenfreigabe in einem AWS-Konto per SQL-Schnittstelle finden Sie unter Freigeben von Daten innerhalb eines AWS-Konto im Datenbankentwicklerhandbuch zu Amazon Redshift.

Über AWS-Konten hinweg können Sie Daten für Lesezwecke von einem Serverless-Endpunkt für andere Serverless-Endpunkte, von einem bereitgestellten Cluster für einen Serverless-Endpunkt oder von einem Serverless-Endpunkt für einen bereitgestellten Cluster freigeben. Weitere Informationen zur Datenfreigabe über AWS-Konten hinweg finden Sie unter Freigeben von Daten in mehreren AWS-Konten im Datenbankentwicklerhandbuch zu Amazon Redshift.

Um Daten in einem AWS-Konto freizugeben, öffnen Sie die AWS Management Console und wählen Sie die Amazon-Redshift-Konsole aus. Klicken Sie auf Serverless configuration (Serverless-Konfiguration) und dann auf Datashares. Befolgen Sie die unter Erste Schritte bei der Datenfreigabe mit der Konsole beschriebenen Verfahren im Datenbankentwicklerhandbuch zu Amazon Redshift.

Um Daten in mehreren AWS-Konten freizugeben, öffnen Sie die AWS Management Console und wählen Sie die Amazon-Redshift-Konsole aus. Klicken Sie auf Datashares (Datenaustausche). Befolgen Sie die unter Erste Schritte bei der Datenfreigabe mit der Konsole beschriebenen Verfahren im Datenbankentwicklerhandbuch zu Amazon Redshift.

Überlegungen zur Datenfreigabe in Amazon Redshift Serverless

Im Folgenden finden Sie Überlegungen für das Arbeiten mit der Amazon-Redshift-Serverless-Datenfreigabe:

  • Bei der Freigabe von Daten für bereitgestellte Cluster unterstützt Amazon Redshift nur die Datenfreigabe auf den Instance-Typen ra3.16xlarge, ra3.4xlarge und ra3.xlplus für Produzenten- und Konsumenten-Cluster.

  • Serverless-Endpunkte sind standardmäßig verschlüsselt.

Eine Liste der Beschränkungen für die Datenfreigabe finden Sie unter Einschränkungen für die Freigabe von Daten im Datenbankentwicklerhandbuch zu Amazon Redshift.

Überwachen von Abfragen und Workloads mit Amazon Redshift Serverless

Sie können Ihre Serverless-Endpunktabfragen und Ihre Workload mit den bereitgestellten Systemansichten überwachen.

Überwachungsansichten

Überwachungsansichten sind Systemansichten in Amazon Redshift Serverless, die zur Überwachung der Abfrage- und Workload-Nutzung verwendet werden. Diese Ansichten befinden sich im pg_catalog-Schema Die verfügbaren Systemansichten wurden entwickelt, um Ihnen die Informationen zu liefern, die zur Überwachung des Serverless-Endpunkts erforderlich sind, was viel einfacher ist als für bereitgestellte Cluster. Die SYS-Systemansichten sind mit Serverless-Endpunkten kompatibel. Um die von diesen Ansichten bereitgestellten Informationen anzuzeigen, führen Sie SQL SELECT-Anweisungen aus.

Systemansichten werden definiert, um die folgenden Überwachungsziele zu unterstützen.

Workload-Überwachung

Sie können Ihre Abfrageaktivitäten im Laufe der Zeit überwachen, um Folgendes zu erreichen:

  • Nachvollziehen von Workload-Mustern, um den Normalzustand (Baseline) und den Umfang geschäftlicher Service Level Agreements (SLAs) zu ermitteln.

  • Schnelles Erkennen von Anomalien, bei denen es sich um gewöhnliche Fluktuationen oder ernsthafte Probleme handeln kann, die behoben werden müssen.

Überwachen von ein- und ausgehenden Daten

Die Datenübertragung in und aus einem Serverless-Endpunkt ist eine kritische Funktion. Sie verwenden COPY und UNLOAD zur Ein- bzw. Ausgabe von Daten, und Sie müssen den Fortschritt in Bezug auf übertragene Byte/Zeilen und abgeschlossene Dateien genau überwachen, um die Einhaltung von Geschäfts-SLAs nachzuverfolgen. Dies geschieht normalerweise durch häufige (d. h. minütliche) Abfragen von Systemtabellen, um den Fortschritt zu verfolgen und Warnungen für Untersuchung/Korrekturmaßnahmen auszulösen, wenn signifikante Abweichungen festgestellt werden.

Fehler- und Problemdiagnose

Es gibt Fälle, in denen Sie Maßnahmen für Abfrage- oder Laufzeitfehler ergreifen müssen. Entwickler nutzen Systemtabellen, um Probleme selbst zu diagnostizieren und richtige Abhilfemaßnahmen zu ermitteln.

Leistungsoptimierung

Möglicherweise müssen Sie Abfragen optimieren, die die SLA-Anforderungen von Anfang an nicht erfüllen oder sich im Laufe der Zeit verschlechtert haben. Zur Optimierung benötigen Sie Laufzeitdetails wie Ausführungsplan, Statistiken, Dauer und Ressourcenverbrauch. Sie benötigen Basisdaten für fehlerhafte Abfragen, um die Ursache für Abweichungen zu ermitteln und Sie bei der Verbesserung zu unterstützen.

Ereignisüberwachung von Benutzerobjekten

Sie müssen Aktionen und Aktivitäten für Benutzerobjekte wie das Aktualisieren materialisierter Ansichten, Bereinigen und Analysieren überwachen. Dies schließt systemverwaltete Ereignisse wie die automatische Aktualisierung für materialisierte Ansichten ein. Sie müssen überwachen, wann ein Ereignis endet, ob es vom Benutzer initiiert wurde, oder die letzte erfolgreiche Ausführung, wenn das System initiiert wurde.

Nutzungsverfolgung für die Abrechnung

Sie können Ihre Nutzungstrends im Laufe der Zeit überwachen, um Folgendes zu erreichen:

  • Informationen für die Budgetplanung und Schätzung von Geschäftskosten.

  • Erkennen von potenziellen Kosteneinsparungen wie das Entfernen kalter Daten.

Sie können STL-, STV-, SVCS-, SVL- und einige SVV-Systemtabellen und -Ansichten mit Amazon Redshift Serverless nicht abfragen, außer den folgenden:

Sie können die folgenden SYS-Systemansichten abfragen, um einen Serverless-Endpunkt zu überwachen.

SYS_QUERY_HISTORY

Verwenden Sie SYS_QUERY_HISTORY, um Details zu Benutzerabfragen anzuzeigen. Jede Zeile stellt eine Benutzerabfrage mit akkumulierten Statistiken für einige der Felder dar. Diese Ansicht enthält viele Arten von Abfragen, wie Data Definition Language (DDL), Data Manipulation Language (DML), Kopieren, Entladen und Amazon Redshift Spectrum. Sie enthält sowohl ausgeführte als auch abgeschlossene Abfragen.

SYS_QUERY_HISTORY ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der die Abfrage gesendet hat.
query_id bigint Die Abfrage-ID.
transaction_id bigint Die Transaktions-ID.
session_id integer Die ID des Prozesses, der die Abfrage ausführt.
database_name character(32) Der Name der Datenbank, mit der der Benutzer verbunden war, als die Abfrage ausgegeben wurde.
start_time timestamp Der Zeitpunkt, zu dem die Abfrage begann.
end_time timestamp Der Zeitpunkt, an dem die Abfrage abgeschlossen wurde.
elapsed_time bigint Die gesamte Zeit (Mikrosekunden), die für die Abfrage aufgewendet wurde.
status character(64) Der Status der Abfrage. Gültige Werte: planning (Planung), queued (In Warteschlange), running (In Ausführung), returning (Wird zurückgegeben), failed (Fehlgeschlagen), canceled (Abgebrochen) und success (Erfolgreich).
result_cache_hit Boolesch Gibt an, ob die Abfrage den Ergebnis-Cache erreicht hat.
queue_time bigint Die Gesamtzeit (Mikrosekunden), die für die Abfragewarteschlange der Serviceklasse aufgewendet wurde.
execution_time bigint Die Gesamtdauer (Mikrosekunden) der Ausführung in der Serviceklasse.
query_text character(4000) Die Abfragezeichenfolge. Diese Zeichenfolge wird möglicherweise abgeschnitten.
query_label Zeichen (320) Der Kurzname für die Abfrage.
query_type character(32) Die Art der Abfrage, wie SELECT, INSERT, UPDATE, UNLOAD COPY, COMMAND, DDL, UTILITY, CTAS und OTHER.
error_message character(512) Der Grund, warum eine Abfrage fehlgeschlagen ist.
returned_rows bigint Die Anzahl der von der Abfrage zurückgegebenen Zeilen.
returned_bytes bigint Die Anzahl der von der Abfrage zurückgegebenen Bytes.
redshift_version character(256) Die Amazon-Redshift-Version, als die Abfrage ausgeführt wurde.

SYS_QUERY_DETAIL

Verwenden Sie SYS_QUERY_DETAIL, um Details für Abfragen auf Schrittebene anzuzeigen. Jede Zeile stellt einen Schritt aus einer bestimmten WLM-Abfrage mit Details dar. Diese Ansicht enthält viele Arten von Abfragen wie DDL-, DML- und Dienstprogrammbefehle (z. B. copy und unload). Einige Spalten sind je nach Abfragetyp möglicherweise nicht relevant. Beispielsweise ist external_scanned_bytes für interne Tabellen nicht relevant.

Anmerkung

Eine Abfrage, die keine entsprechende umgeschriebene Abfrage hat, hat nur einen Eintrag in der Ansicht SYS_QUERY_HISTORY, nicht in der Ansicht SYS_QUERY_DETAIL.

SYS_QUERY_DETAIL ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der die Abfrage gesendet hat.
query_id bigint Die Abfrage-ID.
child_query_sequence integer Die Reihenfolge der neu geschriebenen Benutzerabfrage. Beginnt mit 0, ähnlich wie segment_id.
stream_id integer Die Stream-ID des Streams zur Abfrageausführung.
segment_id integer Die Segment-ID des Abfragesegments.
step_id integer Die Schritt-ID in einem Segment.
step_name character(136) Der Schrittname in einem Segment. Zum Beispiel scan, hash, agg usw.
table_id integer Die Tabellen-ID für permanente Tabellenscans.
table_name character(136) Der Tabellenname des Schritts, der ausgeführt wird.
is_rrsscan character Ein Wert, der angibt, ob ein Schritt ein Scanschritt ist. „True“ (t) zeigt an, dass für diesen Schritt ein Scan mit Bereichseinschränkung durchgeführt wurde.
Warnung character(1024) Die Beschreibung des Warnungsereignisses.
start_time variieren Der Zeitpunkt, zu dem der Abfrageschritt begann.
end_time variieren Der Zeitpunkt, an dem der Abfrageschritt abgeschlossen wurde.
duration bigint Die Zeit (Mikrosekunden), die für den Schritt aufgewendet wurde.
input_bytes bigint Die Eingabebytes für den aktuellen Schritt.
input_rows bigint Die Eingabezeilen für den aktuellen Schritt.
output_bytes bigint Die Ausgabebytes für den aktuellen Schritt.
output_rows bigint Die Ausgabezeilen für den aktuellen Schritt.
blocks_read bigint Die Anzahl der Blocks, die der Schritt gelesen hat.
blocks_write bigint Die Anzahl der Blocks, die der Schritt geschrieben hat.
local_read_blocks bigint Die Anzahl der Lese-I/Os aus dem lokalen Festplatten-Cache.
remote_read_blocks bigint Die Anzahl der remote gelesenen Blöcke.
CPU_time bigint Die CPU-Laufzeit in Mikrosekunden.
network_time bigint Die Zeit für die Netzwerkverteilung in Mikrosekunden.
internal_lock_time bigint Die Zeit für interne Sperren in Mikrosekunden.

SYS_EXTERNAL_QUERY_DETAIL

Verwenden Sie SYS_QUERY_DETAIL, um Details für Abfragen auf Segmentebene anzuzeigen. Jede Zeile repräsentiert ein Segment aus einer bestimmten WLM-Abfrage mit Details wie der Anzahl der verarbeiteten Zeilen, der Anzahl der verarbeiteten Bytes und Partitionsinformationen externer Tabellen in Amazon S3. Jede Zeile in dieser Ansicht hat auch einen entsprechenden Eintrag in der Ansicht SYS_QUERY_DETAIL, außer dass diese Ansicht detailliertere Informationen zur externen Abfrageverarbeitung enthält.

SYS_EXTERNAL_QUERY_DETAIL ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der die Abfrage gesendet hat.
query_id bigint Die Abfrage-ID der externen Abfrage.
child_query_sequence integer Die Reihenfolge der neu geschriebenen Benutzerabfrage. Beginnt mit 0, ähnlich wie segment_id.
transaction_id bigint Die Transaktions-ID.
segment_id integer Die Segment-ID des Abfragesegments.
source_type character(32) Der Datenquellentyp der Abfrage. Es kann sich um S3 für Redshift Spectrum und PG für Verbundabfragen handeln.
start_time variieren Der Zeitpunkt, zu dem die Abfrage begann.
end_time variieren Der Zeitpunkt, an dem die Abfrage abgeschlossen wurde.
duration bigint Die Zeit (Mikrosekunden), die für die Abfrage aufgewendet wurde.
total_partitions integer Die Anzahl der Partitionen, die eine Amazon-S3-Abfrage benötigt hat.
qualified_partitions integer Die Anzahl der Partitionen, die eine Amazon-S3-Abfrage gescannt hat.
scanned_files integer Die Anzahl der von Amazon S3 gescannten Dateien.
returned_rows bigint Die Anzahl der gescannten Zeilen für eine Amazon-S3-Abfrage oder die Anzahl der zurückgegebenen Zeilen für eine Verbundabfrage.
returned_bytes bigint Die Anzahl der gescannten Bytes für eine Amazon-S3-Abfrage oder die Anzahl der zurückgegebenen Bytes für eine Verbundabfrage.
file_format character(16) Das Dateiformat von Amazon-S3-Dateien.
file_location character(256) Der Amazon-S3-Speicherort der externen Tabelle.
external_query_text character(4000) Der Abfragetext auf Segmentebene für eine Verbundabfrage.

SYS_LOAD_HISTORY

Verwenden Sie SYS_LOAD_HISTORY, um Details zu COPY-Befehlen anzuzeigen. Jede Zeile stellt einen COPY-Befehl mit akkumulierten Statistiken für einige der Felder dar. Sie enthält sowohl ausgeführte als auch abgeschlossene COPY-Befehle.

SYS_LOAD_HISTORY ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der die Kopie gesendet hat.
query_id bigint Die Abfrage-ID der Kopie.
status character(64) Der Status der Kopie. Gültige Werte sind running, completed, aborted.
session_id integer Die ID des Prozesses, der die Kopie ausführt.
transaction_id bigint Die Transaktions-ID.
database_name character(64) Der Name der Datenbank, mit der der Benutzer verbunden war, als der Vorgang ausgegeben wurde.
table_name character(128) Der Name der Tabelle, die Informationen kopiert hat.
start_time timestamp Der Zeitpunkt, zu dem die Kopie begann.
end_time timestamp Der Zeitpunkt, an dem die Kopie abgeschlossen wurde.
duration bigint Die Dauer (in Mikrosekunden) des COPY-Befehls.
data_source character(256) Der Amazon-S3-Speicherort der zu kopierenden Dateien.
loaded_rows bigint Die Anzahl der in eine Tabelle kopierten Zeilen.
loaded_bytes bigint Die Anzahl der in eine Tabelle kopierten Bytes.
source_file_count integer Die Anzahl der Dateien in Quelldateien.
source_file_bytes bigint Die Anzahl der Bytes in Quelldateien.
error_count integer Die Anzahl der Fehler.

SYS_LOAD_ERROR_DETAIL

Verwenden Sie SYS_LOAD_ERROR_DETAIL, um Details zu Fehlern bei COPY-Befehlen anzuzeigen. Jede Zeile repräsentiert einen COPY-Befehl. Sie enthält sowohl ausgeführte als auch abgeschlossene COPY-Befehle.

SYS_LOAD_ERROR_DETAIL ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der die Kopie gesendet hat.
database_name character(64) Der Name der Datenbank, mit der der Benutzer verbunden war, als die Kopie ausgegeben wurde.
transaction_id bigint Die Transaktions-ID.
session_id integer Die ID des Prozesses, der die Kopie ausführt.
query_id bigint Die Abfrage-ID der Kopie.
table_id integer Die Tabellenkennung.
start_time timestamp Die Uhrzeit (in UTC), zu der die Kopie begann.
file_name character(256) Der vollständige Pfad zur zu ladenden Eingabedatei.
line_number bigint Die Zeilennummer in der Ladedatei mit dem Fehler. Beim Laden einer JSON-Datei ist dies die Nummer der letzten Zeile des JSON-Objekts mit dem Fehler.
column_name character(127) Das Feld mit dem Fehler.
column_type character(10) Der Datentyp des Felds mit dem Fehler.
column_length character(10) Die Spaltenlänge, falls zutreffend. Dieses Feld ist gefüllt, wenn für den Datentyp eine Längenbegrenzung gilt. So enthält diese Spalte beispielsweise für eine Spalte mit dem Datentyp „character(3)“ den Wert „3“.
position integer Die Position des Fehlers in dem Feld.
raw_line character(1024) Die Rohladedaten, die den Fehler enthalten. Multibyte-Zeichen in den Ladedaten werden durch einen Punkt ersetzt.
raw_field_value character(1024) Der Wert des Feldes column-name vor dem Parsing, der zu dem Ladefehler geführt hat.
error_code integer Der Fehlercode.
error_message character(100) Die Erläuterung des Fehlers.

SYS_UNLOAD_HISTORY

Verwenden Sie UNLOAD_HISTORY, um Details zu UNLOAD-Befehlen anzuzeigen. Jede Zeile stellt einen UNLOAD-Befehl mit akkumulierten Statistiken für einige der Felder dar. Sie enthält sowohl ausgeführte als auch abgeschlossene UNLOAD-Befehle.

SYS_UNLOAD_HISTORY ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
user_id integer Die ID des Benutzers, der den Entladevorgang gestartet hat.
query_id bigint Die Abfrage-ID des UNLOAD-Befehls.
session_id integer Die ID des Prozesses, der den Entladevorgang ausführt.
status character(64) Der Status des UNLOAD-Befehls. Gültige Status sind running und completed.
transaction_id bigint Die Transaktions-ID.
database_name character(64) Der Name der Datenbank, mit der der Benutzer verbunden war, als der Vorgang ausgegeben wurde.
start_time timestamp Der Zeitpunkt, zu dem der Entladevorgang begann.
end_time timestamp Der Zeitpunkt, an dem der Entladevorgang abgeschlossen wurde.
duration bigint Die Dauer (in Mikrosekunden) des UNLOAD-Befehls.
file_format varchar Gibt das Dateiformat der Ausgabedateien an.
compression_type varchar Der Komprimierungstyp.
unload_location character(256) Der Amazon-S3-Speicherort von entladenen Dateien.
unloaded_rows bigint Die Anzahl der Zeilen.
unloaded_files_count integer Die Anzahl der Dateien in der Ausgabedatei.
unloaded_files_size integer Die Dateigröße der Ausgabedatei.
error_message character(128) Die Fehlermeldung des UNLOAD-Befehls.

SYS_SERVERLESS_USAGE

Verwenden Sie SYS_SERVERLESS_USAGE, um Details zur Serverless-Endpunktauslastung von Ressourcen anzuzeigen.

Diese Ansicht enthält die Zusammenfassung der Serverless-Nutzung, mit einer Genauigkeit von 30 Minuten, einschließlich wie viel Rechenkapazität für die Verarbeitung von Abfragen verwendet wird und wie viel des von Amazon Redshift verwalteten Speichers verwendet wird. Die Rechenkapazität von Serverless-Endpunkten wird für ausgeführte Workloads in Redshift Processing Units (RPUs) pro Sekunde, also RPU-Sekunden, gemessen. RPUs werden verwendet, um Abfragen von Daten zu verarbeiten, die in ein Data Warehouse geladen wurden, aus einem Amazon-S3-Data-Lake abgefragt oder über Betriebsdatenbanken per Verbundabfrage aufgerufen werden.

SYS_SERVERLESS_USAGE ist für alle Benutzer sichtbar. Superuser können alle Zeilen anzeigen, während normale Benutzer nur die Metadaten anzeigen können, auf die sie Zugriff haben.

Tabellenspalten
Spaltenname Datentyp Beschreibung
start_time timestamp Der Zeitpunkt, zu dem das Intervall begann.
end_time timestamp Der Zeitpunkt, an dem das Intervall abgeschlossen wurde.
compute_capacity integer Die durchschnittliche Anzahl von Recheneinheiten (Redshift Processing Units, RPUs), die während dieses Zeitintervalls zugewiesen wurden.

Der Wert compute_capacity kann dynamisch geändert werden. Angenommen, der Serverless-Endpunkt hat in einem 30-Minuten-Intervall in den ersten 15 Minuten 20 RPUs zugewiesen und für die nächsten 15 Minuten auf 40 RPUs hochskaliert. In diesem Fall beträgt die durchschnittliche compute_capacity 30 RPUs.

compute_seconds integer Die kumulierten genutzten Recheneinheiten (in RPU-Sekunden) für dieses Zeitintervall.

Während des Intervalls kann es eine Leerlaufzeit geben. Angenommen, die compute_capacity beträgt 10 RPUs, aber Abfragen laufen in einem 30-Minuten-Intervall nur 60 Sekunden lang. Dann trifft Folgendes zu.

compute_seconds (rpu_seconds) = 10 * 60
data_storage integer Der durchschnittliche Datenspeicherplatz, der in diesem Zeitintervall verwendet wird.

Der verwendete Datenspeicher kann sich dynamisch ändern, wenn Daten aus der Datenbank geladen oder gelöscht werden. Angenommen, der Serverless-Endpunkt hat in einem 30-Minuten-Intervall in den ersten 15 Minuten 10 TB gespeichert und für die nächsten 15 Minuten 10 TB geladen. In diesem Fall beträgt der used_data_storage 15 TB.

Sicherheit und Verbindungen in Amazon Redshift Serverless

Für den Zugriff auf Amazon Redshift werden Anmeldeinformationen benötigt, die AWS zur Authentifizierung Ihrer Anforderungen verwenden kann.

Identity and Access Management in Amazon Redshift Serverless

Für den Zugriff auf Amazon Redshift werden Anmeldeinformationen benötigt, die AWS zur Authentifizierung Ihrer Anforderungen verwenden kann. Diese Anmeldeinformationen müssen über Berechtigungen für den Zugriff auf AWS-Ressourcen verfügen, z. B. einen Serverless-Endpunkt.

In den folgenden Abschnitten erfahren Sie, wie Sie Ihre Ressourcen mithilfe von AWS Identity and Access Management (IAM) und Amazon Redshift sichern können, indem Sie den Zugriff darauf kontrollieren: Weitere Informationen finden Sie unter Identity and Access Management in Amazon Redshift.

Amazon Redshift Serverless Berechtigungen gewähren

Um auf andere AWS-Services zuzugreifen, benötigt Amazon Redshift Serverless Berechtigung.

Amazon Redshift Serverless autorisieren, in Ihrem Namen auf andere AWS-Services zuzugreifen

Für einige Amazon-Redshift-Funktionen ist es erforderlich, dass Amazon Redshift in Ihrem Namen auf andere AWS-Services zugreift. Damit Ihre Amazon-Redshift-Serverless-Endpunkte für Sie handeln können, geben Sie Ihren Endpunkten Sicherheitsanmeldeinformationen an. Zur Bereitstellung von Sicherheitsanmeldeinformationen geben Sie am besten eine AWS Identity and Access Management (IAM)-Rolle an. Sie können auch eine IAM-Rolle über die Amazon-Redshift-Konsole erstellen und als Standard festlegen. Weitere Informationen finden Sie unter Erstellen einer IAM-Rolle als Standard für Amazon Redshift.

Um auf andere AWS-Services zuzugreifen, erstellen Sie eine IAM-Rolle mit den entsprechenden Berechtigungen. Sie müssen die Rolle auch Ihrem Serverless-Endpunkt zuordnen. Geben Sie außerdem entweder den Amazon-Ressourcennamen (ARN) der -Rolle an, wenn Sie den Amazon-Redshift-Befehl ausführen, oder geben Sie das default-Schlüsselwort an.

Wenn Sie die Vertrauensbeziehung für die IAM-Rolle unter https://console.aws.amazon.com/iam/ ändern, verwenden Sie redshift.amazonaws.com als Servicenamen. Informationen darüber, wie Sie IAM-Rollen ändern, um andere AWS-Services in Ihrem Namen aufzurufen, finden Sie unter Amazon Redshift autorisieren, in Ihrem Namen auf andere AWS-Services zuzugreifen.

Erstellen einer IAM-Rolle als Standard für Amazon Redshift

Wenn Sie IAM-Rollen über die Amazon-Redshift-Konsole erstellen, erstellt Amazon Redshift programmgesteuert die Rollen in Ihrem AWS-Konto. Amazon Redshift fügt zudem automatisch vorhandene von AWS verwaltete Richtlinien an sie an. Bei dieser Methode können Sie in der Amazon-Redshift-Konsole bleiben und müssen zur Rollenerstellung nicht zur IAM-Konsole wechseln.

Bei der IAM-Rolle, die Sie über die Konsole für Ihren Cluster erstellen, ist die verwaltete Richtlinie AmazonRedshiftAllCommandsFullAccess automatisch angefügt. Diese IAM-Rolle ermöglicht es Amazon Redshift, Daten für AWS-Ressourcen in Ihrem IAM-Konto zu kopieren, zu entladen, abzufragen und zu analysieren. Zu den entsprechenden Befehlen gehören COPY, UNLOAD, CREATE EXTERNAL FUNCTION, CREATE EXTERNAL TABLE, CREATE EXTERNAL SCHEMA, CREATE MODEL und CREATE LIBRARY. Weitere Informationen zum Erstellen einer IAM-Roll als Standard für Amazon Redshift finden Sie unter Erstellen einer IAM-Rolle als Standard für Amazon Redshift.

Um eine IAM-Rolle als Standard für Amazon Redshift zu erstellen, öffnen Sie die AWS Management Console, wählen Sie die Amazon-Redshift-Konsole und dann Try Amazon Redshift Serverless (Amazon Redshift Serverless testen) aus. Wählen Sie in der Amazon-Redshift-Serverless-Konsole Customize settings (Einstellungen anpassen) aus. Befolgen Sie unter Permissions (Berechtigungen) die Verfahren aus Verwendung der Konsole zur Verwaltung der Verknüpfungen von IAM-Rollen.

Wenn Sie bereits über einen Serverless-Endpunkt verfügen und IAM-Rollen für Ihren Endpoint konfigurieren möchten, öffnen Sie die AWS Management Console. Wählen Sie die Amazon-Redshift-Konsole und dann Go to serverless (Zu Serverless) aus. Wählen Sie in der Amazon-Redshift-Serverless-Konsole Serverless configuration (Serverless-Konfiguration) und dann Data access (Datenzugriff) aus. Befolgen Sie unter Permissions (Berechtigungen) die Verfahren aus Verwendung der Konsole zur Verwaltung der Verknüpfungen von IAM-Rollen.

Erste Schritte mit IAM-Anmeldeinformationen für Amazon Redshift

Wenn Sie sich zum ersten Mal bei der Amazon-Redshift-Konsole anmelden und Amazon Redshift Serverless zum ersten Mal ausprobieren, können Sie sich entweder als IAM-Benutzer oder als IAM-Rolle anmelden. Nachdem Sie mit dem Erstellen eines Serverless-Endpunkts begonnen haben, zeichnet Amazon Redshift Ihren IAM-Benutzernamen oder Rollennamen auf, den Sie bei der Anmeldung verwendet haben. Sie können dieselben IAM-Anmeldeinformationen verwenden, um sich bei der Amazon-Redshift-Konsole und der Amazon-Redshift-Serverless-Konsole anzumelden.

Während Sie einen Serverless-Endpunkt erstellen, können Sie eine Datenbank in Ihrem Serverless-Endpunkt erstellen. Verwenden Sie den Abfrage-Editor v2, um mit der Option für temporäre Anmeldeinformationen eine Verbindung zur Datenbank herzustellen.

Um einen neuen Admin-Benutzernamen und ein neues Passwort permanent für die Datenbank hinzuzufügen, wählen Sie Customize admin user credentials (Anpassen von Administratoranmeldeinformationen) aus und geben Sie einen neuen Benutzernamen und ein Passwort für den Administrator ein.

Verwenden Sie einen IAM-Benutzer oder eine IAM-Rolle, um Amazon Redshift Serverless zu verwenden und zum ersten Mal einen Serverless-Endpunkt in der Serverless-Endpunktkonsole zu erstellen. Stellen Sie sicher, dass dieser Benutzer oder diese Rolle entweder über die Administratorberechtigung arn:aws:iam::aws:policy/AdministratorAccess oder die vollständige Amazon-Redshift-Berechtigung arn:aws:iam::aws:policy/AmazonRedshiftFullAccess verfügt, die mit der von Ihnen verwendeten IAM-Richtlinie verbunden ist.

In den folgenden Szenarien wird beschrieben, wie Ihre IAM-Anmeldeinformationen von Amazon Redshift Serverless verwendet werden, wenn Sie mit der Amazon-Redshift-Serverless-Konsole beginnen:

  • Wenn Sie Use default settings (Standardeinstellungen verwenden) angeben, wandelt Amazon Redshift Serverless Ihre aktuelle IAM-Identität in einen Datenbank-Superuser um. Sie können dieselbe IAM-Identität mit der Amazon-Redshift-Serverless-Konsole verwenden, um Superuser-Aktionen in Ihrer Datenbank auf dem Serverless-Endpunkt durchzuführen.

  • Wen Sie Customize settings (Einstellungen anpassen) auswählen, ohne einen Administrator-Benutzernamen und ein Passwort anzugeben, verwendet Amazon Redshift Serverless Ihre aktuellen IAM-Anmeldeinformationen als Ihre Standard-Administratoranmeldeinformationen. Dies entspricht im Grunde der Option Use default settings (Standardeinstellungen verwenden).

  • Wenn Sie Customize settings (Einstellungen anpassen) auswählen und einen Administrator-Benutzernamen und ein Passwort angeben, wandelt Amazon Redshift Serverless Ihre aktuelle IAM-Identität in einen Datenbank-Superuser um. Amazon Redshift Serverless erstellt auch eine weitere dauerhafte Kombination aus Benutzername und Passwort für einen Superuser. Sie können entweder Ihre aktuelle IAM-Identität oder das erstellte Paar aus Benutzername und Passwort verwenden, um sich als Superuser in Ihrer Datenbank anzumelden.

Prüfungsprotokollierung für Amazon Redshift Serverless

Exportieren von Protokollen

Sie können Amazon Redshift Serverless so konfigurieren, dass Verbindungs-, Benutzer- und Benutzeraktivitätsprotokolldaten in eine Protokollgruppe in Amazon CloudWatch Logs exportiert werden. Mit Amazon CloudWatch Logs können Sie Echtzeitanalysen der Protokolldaten durchführen, und mit CloudWatch können Sie Alarme und Metriken erstellen. Sie können CloudWatch Logs verwenden, um Ihre Protokolldatensätze in einem beständigen Speicher abzulegen.

Redshift generiert standardmäßig Verbindungs- und Benutzerprotokolldaten. Die Generierung von Protokolldaten für Benutzeraktivitäten, z. B. Daten mit Abfragen, die von einzelnen Benutzern ausgeführt werden, muss explizit aktiviert werden. Legen Sie dazu die Konfigurationseinstellung fest, um Benutzeraktivitätsdaten zu generieren.

aws redshift-serverless set-configuration --config-parameters parameterKey=enable_user_activity_logging,parameterValue=true

Um generierte Protokolldaten in Amazon CloudWatch Logs zu exportieren, müssen die entsprechenden Protokolle für den Export in den Serverless-Endpunktkonfigurationseinstellungen auf der Konsole ausgewählt werden.

Überwachen von Protokollereignissen in CloudWatch

Nachdem Sie ausgewählt haben, welche Redshift-Protokolle exportiert werden sollen, können Sie Ereignisse in Amazon CloudWatch Logs überwachen. Eine neue Protokollgruppe für Amazon Redshift Serverless wird automatisch mit folgendem Präfix erstellt, in dem log_type für den Protokolltyp steht.

/aws/redshift/serverless/<log_type>

Wenn Sie beispielsweise das Verbindungsprotokoll exportieren möchten, werden die Protokolldaten in der folgenden Protokollgruppe gespeichert.

/aws/redshift/serverless/connectionlog

Protokollereignisse werden mithilfe des Serverless-Protokollstreams in eine Protokollgruppe exportiert. Das Verhalten hängt davon ab, welche der folgenden Bedingungen zutrifft:

  • Eine Protokollgruppe mit dem angegebenen Namen existiert. Redshift exportiert Protokolldaten für den Serverless-Endpunkt unter Verwendung der vorhandenen Protokollgruppe. Um Protokollgruppen mit vordefinierten Protokollaufbewahrungszeiten, Metrikfiltern und Kundenzugriff zu erstellen, können Sie die automatisierte Kommunikation wie die verwenden, die von AWS CloudFormation bereitgestellt wird.

  • Eine Protokollgruppe mit dem angegebenen Namen existiert nicht. Wenn im Protokoll für die Instance ein übereinstimmender Protokolleintrag erkannt wird, erstellt Amazon Redshift Serverless automatisch eine neue Protokollgruppe in Amazon CloudWatch Logs. Die Protokollgruppe nutzt den standardmäßigen Aufbewahrungszeitraum für Protokolle Never Expire (Läuft nie ab). Um die Protokollaufbewahrungszeit zu ändern, können Sie die Amazon-CloudWatch-Logs-Konsole, die AWS CLI oder die Amazon-CloudWatch-Logs-API verwenden. Weitere Informationen zum Anpassen des Aufbewahrungszeitraums von Protokollen in CloudWatch Logs finden Sie unter Ändern der Aufbewahrung von Protokolldaten in Arbeiten mit Protokollgruppen und Protokollstreams.

Um Informationen in Protokollereignissen für Ihren Serverless-Endpunkt zu suchen, können Sie die Amazon CloudWatch-Logs-Konsole, die AWS CLI oder die Amazon CloudWatch-Logs-API verwenden. Weitere Informationen finden Sie unter Suchen und Filtern von Protokolldaten.

Verbinden mit Amazon Redshift Serverless von anderen VPC-Endpunkten

Sie können von anderen VPC-Endpunkten aus eine Verbindung zu Amazon Redshift Serverless herstellen, einschließlich lokaler und öffentlicher VPC-Endpunkte.

Herstellen einer Verbindung vom öffentlichen Subnetz mit dem Amazon-Redshift-Serverless-Endpunkt mithilfe des Network Load Balancer

Um den öffentlichen Zugriff auf den Amazon-Redshift-Serverless-Endpunkt zu ermöglichen, konfigurieren Sie den Network Load Balancer in der VPC so, dass er die neue Zielgruppe überwacht, die so konfiguriert ist, dass sie den Datenverkehr an den verwalteten VPC-Endpunkt von Amazon Redshift Serverless im Konto weiterleitet. Weitere Informationen finden Sie im AWS PrivateLink-Leitfaden und Benutzerhandbuch für Network Load Balancer.

  1. Rufen Sie die VPC-Endpunkt-ID und die SubnetId in allen Availability Zones ab.

  2. Rufen Sie die privateIpAddress, subnetIds und vpcId.

  3. Verwenden Sie AWS CloudFormation, um die Vorlage redshift-nlb.yml zu installieren und den Network Load Balancer und die Listener-Zielgruppe zu erstellen. Geben Sie die privateIpAddress und die SubnetIDs an, um den Stack zu erstellen.

  4. In der Registerkarte „AWS CloudFormation Outputs“ (AWS CloudFormation-Ausgaben) wählen Sie die Registerkarte „CFN“, um den DNS-Namen des Network Load Balancer abzurufen.

Herstellen einer Verbindung mit Amazon Redshift aus einem öffentlichen Subnetz

Das DNS des Network Load Balancer dient zur Verbindung mit Amazon Redshift über das öffentliche Subnetz.

In PSQL verwenden Sie eine Syntax wie die Folgende.

psql "host=redshift-serverless-dns-name.region.amazonaws.com dbname=dev port=5439 user=admin"

Um Ihren bevorzugten Abfrage-Editor und JDBC-Treiberversion 2 zu verwenden, stellen Sie sicher, dass SSL aktiviert und die Überprüfung des Serverzertifikats deaktiviert ist. Verwenden Sie eine Syntax wie die folgende.

jdbc:redshift://dns-name.region.amazonaws.com:5439/dev?useSSL=true&verifyServerCertificate=false

Arbeiten mit Snapshots und Wiederherstellungspunkten

Sie können manuelle Snapshots erstellen und löschen, die alle Datenbanken in einem Serverless-Endpunkt enthalten. Sie können Ihren Serverless-Endpunkt mit Snapshots eines Serverless-Endpunkts oder bereitgestellten Clusters wiederherstellen. Über Manage access (Zugriff verwalten) können Sie bestimmen, welche Snapshots von Ihrem eigenen oder von einem anderen AWS-Konto abgerufen werden können. Der Wiederherstellungsvorgang ersetzt den Serverless-Endpunkt durch alle im Snapshot enthaltenen Datenbanken. Darüber hinaus können Sie Ihr Data Warehouse auf Wiederherstellungspunkte zurücksetzen, die alle 30 Minuten gespeichert und 24 Stunden lang aufbewahrt werden.

Wenn Ihr Serverless-Endpunkt wiederhergestellt ist, wird die erste Phase der Wiederherstellung in wenigen Minuten abgeschlossen und Ihre Daten stehen für Abfragen zur Verfügung. Es gibt eine zweite Wiederherstellungsphase, in der Ihre Datenbank optimiert wird. In dieser Phase kann sich die Leistung etwas verschlechtern. Die zweite Phase kann einige Stunden bis hin zu mehreren Tagen und in einigen Fällen ein paar Wochen dauern. Die Dauer hängt von der Datenmenge ab, die Leistung verbessert sich jedoch schrittweise. Am Ende dieser Phase ist Ihr Serverless-Endpunkt vollständig optimiert.

Snapshots

Sie können einen Snapshot wiederherstellen, den Sie mit der Amazon-Redshift-Serverless-Konsole erstellt haben, um die Daten auf Ihrem Serverless-Endpunkt zu ersetzen. Wenn ein Snapshot auf einem Serverless-Endpunkt wiederhergestellt wird, wird der KMS-Schlüssel des Serverless-Endpunkts verwendet, um die Daten zu verschlüsseln.

So verwalten Sie den Zugriff auf einen Snapshot

  1. Starten Sie auf der Amazon-Redshift-Serverless-Konsole und navigieren Sie zur Seite Serverless configuration (Serverless-Konfiguration) und der Registerkarte Data backup (Datensicherung).

  2. Wählen Sie Action (Aktion) und Manage access (Zugriff verwalten) aus.

  3. Geben Sie eine AWS-Konto-ID ein, um es zu autorisieren, den Snapshot zu verwenden.

Stellen Sie einen Snapshot von Ihrem Serverless-Konto wie folgt wieder her

  1. Starten Sie auf der Amazon-Redshift-Serverless-Konsole und navigieren Sie zur Seite Serverless configuration (Serverless-Konfiguration) und der Registerkarte Data backup (Datensicherung).

  2. Wählen Sie einen Snapshot zum Verwenden aus.

  3. Wählen Sie Action (Aktion), Restore from snapshot (Von Snapshot wiederherstellen) aus.

Stellen Sie einen Snapshot von Ihrem bereitgestellten Cluster wie folgt auf Ihrem Serverless-Endpunkt

  1. Navigieren Sei von der Konsole des von Amazon Redshift bereitgestellten Clusters aus zur Seite Clusters, Snapshots.

  2. Wählen Sie einen Snapshot zum Verwenden aus.

  3. Wählen Sie Restore from Snapshot (Von Snapshot wiederherstellen) ,Restore to serverless endpoint (Auf Serverless-Endpunkt wiederherstellen) aus.

  4. Bestätigen Sie, dass Sie von Ihrem Snapshot aus wiederherstellen möchten. Diese Aktion ersetzt alle Datenbanken auf Ihrem Serverless-Endpunkt durch die Daten aus Ihrem bereitgestellten Cluster.

Weitere Informationen über Snapshots auf bereitgestellten Clustern finden Sie unter Amazon-Redshift-Snapshots im Amazon-Redshift-Clusterverwaltungshandbuch.

Wiederherstellungspunkte

Wiederherstellungspunkte werden alle 30 Minuten für Ihren Serverless-Endpunkt erstellt und 24 Stunden lang gespeichert.

Sie können Wiederherstellungspunkte auf der Registerkarte Serverless configuration (Serverless-Konfiguration), Backup data (Daten sichern) der Amazon-Redshift-Serverless-Konsole verwalten. Sie können die folgenden Operationen verwenden:

  • Einen Serverless-Endpunkt auf einen Wiederherstellungspunkt wiederherstellen.

  • Einen Wiederherstellungspunkt in einen Snapshot konvertieren.

Automatische Kapazitätsskalierung mit Basis- und Maximalparametern

Amazon Redshift Serverless misst die Rechenkapazität von Data Warehouses in Redshift Processing Units (RPUs). Sie zahlen für Workloads, die Sie in RPU-Stunden ausführen, auf Sekundenbasis. Für die Speicherung zahlen Sie für Daten, die im verwalteten Speicher von Amazon Redshift gespeichert sind, zu einer auf Gigabyte pro Monat basierenden Rate.

Bereitstellen und Skalieren von Ressourcen in Amazon Redshift Serverless

Optional können Sie die Basis- und Maximaleinstellungen verwenden, um Leistung und Kosten zu steuern.

Basis

Stellt die Basiskapazität des Data Warehouse dar, die Amazon Redshift Serverless zur Verarbeitung von Abfragen verwendet. Die Basiskapazität wird in Redshift Processing Units (RPUs) angegeben. Das Festlegen einer höheren Basisrechenkapazität kann die Abfrageleistung verbessern, insbesondere bei Datenverarbeitungs- und ETL-Aufträgen, die große Datenmengen verarbeiten. Der Standardwert ist AUTO, sodass der Serverless-Endpunkt die richtige Data-Warehouse-Kapazität automatisch zuweisen und anpassen kann. Sie können die Basis in Einheiten von 8 (32, 40, 48...512) von 32 RPUs auf 512 RPUs erhöhen. Dazu nutzen Sie entweder die Serverless-Endpoint-Managementkonsole oder Sie rufen eine Amazon-Redshift-API auf.

Max

Gibt Nutzungslimits an. Das Festlegen einer höheren maximalen Rechenkapazität kann den Gesamtdurchsatz des Systems verbessern, was Workloads mit hoher Nebenläufigkeit zugutekommt und gleichzeitig eine hohe Leistung aufrechterhält.

Bei der Speicherung zahlen Sie für Daten, die im von Amazon Redshift verwalteten Speicher und im Speicher für Benutzer-Snapshots zu einer festen Monatsrate pro GB gespeichert sind, ähnlich wie bei von Amazon Redshift bereitgestellten Clustern. Mit Amazon Redshift Serverless können Sie Ihr Data Warehouse ohne zusätzliche Kosten auf bestimmte Wiederherstellungspunkte zurücksetzen, Diese werden alle 30 Minuten für einen Zeitraum von 24 Stunden gespeichert. Für die Datenübertragung und Machine Learning gelten die gleichen Raten wie für bereitgestellte Cluster.

Abrechnung für Amazon Redshift Serverless

Funktionsweise der Abrechnung

Bei Amazon Redshift Serverless wird Ihnen die Dauer in Rechnung gestellt, für die Ihre Rechenressourcen Abfragen ausführen. Die Rechenleistung eines Serverless-Endpunkts wird in Redshift Processing Units oder RPUs gemessen. Eine RPU bezieht sich auf eine Basiseinheit von Ressourcen, gemessen in virtuellen CPUs und Arbeitsspeicher. Ein Serverless-Endpunkt mit mehr Ressourcen hat eine höhere Anzahl von RPUs. Die Abrechnung erfolgt nach RPUs pro Sekunde.

Ihnen wird nicht die Rechenkapazität in Rechnung gestellt, sondern die Zeit, die für die Bearbeitung von Abfragen aufgewendet wurde. Dies bedeutet, dass Ihnen keine Leerlaufkapazität in Rechnung gestellt wird. Der Speicher wird separat mit einem Satz von GB pro Monat berechnet.

Um Ihre Kosten zu kontrollieren, können Sie eine maximale Ausgabenrate für Ihren Serverless-Endpunkt festlegen. Dies ist eine Verarbeitungskapazitätsgrenze, die eine Kostenobergrenze vorsieht. Sie können sie jederzeit ohne Unterbrechung der Abfrageverarbeitung anpassen.

Wie sich die Abrechnung von Amazon Redshift Serverless von bereitgestellten Clustern unterscheidet

Wenn Sie einen bereitgestellten Redshift-Cluster verwenden, beruht die Abrechnung auf der Anzahl der Knoten im Cluster und dem Typ der Knoten. Bei Amazon Redshift Serverless verwalten Sie die Clustergröße oder den Knotentyp nicht. Der Serverless-Endpunkt wird automatisch angepasst und geladen. Sie müssen Ihren Endpunkt auch nicht pausieren, wenn er inaktiv ist. Amazon Redshift Serverless managt die Leerlaufzeit automatisch.

Mehr zur Abrechnung

  • Die Abrechnung umfasst die Nebenläufigkeitsskalierung zu Stoßzeiten. Die Nebenläufigkeitsskalierung ist in der Abrechnungsgebühr enthalten.

  • Systemabfragen für Verwaltung und Überwachung werden nicht in Rechnung gestellt. Darüber hinaus werden automatische Optimierungen wie automatische Sortierung und Bereinigung nicht berechnet.

  • Redshift-Spectrum-Abfragen werden mit der gleichen Rate für Abfragen lokaler Daten abgerechnet.

  • Verbundabfragen werden in Bezug auf RPUs berechnet, die über ein bestimmtes Zeitintervall verwendet werden, genau wie Abfragen auf dem Serverless-Endpunkt.

  • Der Speicher wird separat abgerechnet, zur angegebenen Rate pro GB.

  • Das minimale Abrechnungsintervall beträgt eine Sekunde. Wenn Sie beispielsweise eine Abfrage für 100 Millisekunden ausführen, wird Ihnen eine Sekunde in Rechnung gestellt.

  • Die Snapshot-Abrechnung ändert sich nicht. Sie wird in GB pro Monat berechnet.

  • Wenn Sie eine Abfrage ausführen und abbrechen, bevor sie abgeschlossen ist, wird die Abfragezeit in Rechnung gestellt.