Bereitgestellte Amazon-Redshift-Cluster – Überblick - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereitgestellte Amazon-Redshift-Cluster – Überblick

Der Amazon-Redshift-Service verwaltet alle Arbeiten zur Einrichtung, zum Betrieb und zum Skalieren eines Data Warehouse. Zu diesen Aufgaben gehören auch die Bereitstellung von Kapazitäten, die Überwachung und das Sichern des Clusters sowie das Anwenden von Patches und Upgrades auf die Amazon-Redshift-Engine.

Das folgende Video zeigt Ihnen, wie Sie mit Amazon Redshift Query Editor v2 einen Cluster erstellen und Daten abfragen.

Clusterverwaltung

Ein Amazon-Redshift-Cluster besteht aus einer Reihe von Knoten, darunter einem Führungsknoten und einem oder mehreren Rechenknoten. Die Anzahl und Art der benötigten Rechenknoten hängt von der Größe Ihrer Daten, der Anzahl der auszuführenden Abfragen und der benötigten Abfrage-Laufzeitleistung ab.

Erstellen und Verwalten von Clustern

Sie können, je nach Anforderungen an Ihr Data Warehousing, zunächst mit einem kleinen Cluster mit einem Arbeitsknoten beginnen, bei Bedarf jedoch problemlos die Anzahl der Knoten in dem Cluster beliebig hochskalieren, wenn sich Ihre Anforderungen ändern. Sie können einem Cluster im laufenden Betrieb Verarbeitungsknoten hinzufügen und entfernen. Weitere Informationen finden Sie unter Von Amazon Redshift bereitgestellte Cluster.

Reservieren von Datenverarbeitungsknoten

Wenn Sie planen, Ihren Cluster ein ganzes Jahr und länger zu betrieben, können Sie Geld sparen, indem Sie Knoten für einen Zeitraum von 1 oder 3 Jahren reservieren. Das Reservieren von Verarbeitungsknoten ist deutlich preisgünstiger als die Stundensätze, die anfallen, wenn Sie Verarbeitungsknoten auf Anfrage bereitstellen. Weitere Informationen finden Sie unter Kaufen reservierter Amazon-Redshift-Knoten.

Erstellen von Cluster-Snapshots

Snapshots sind point-in-time Backups eines Clusters. Es gibt zwei Arten von Snapshots: automatisierte und manuelle. Amazon Redshift speichert diese Snapshots intern in Amazon Simple Storage Service (Amazon S3) unter Verwendung einer verschlüsselten Secure Sockets Layer (SSL)-Verbindung. Wenn Sie einen Cluster anhand eines Snapshots wiederherstellen müssen, erstellt Amazon Redshift einen neuen Cluster und importiert dann die Daten aus dem von Ihnen angegebenen Snapshot. Weitere Informationen zu -Snapshots finden Sie unter Amazon-Redshift-Snapshots und -Sicherungen.

Zugriff und Sicherheit bei Clustern

Es gibt in Amazon Redshift mehrere Funktionen für den Zugriff auf und die Sicherheit von Clustern. Mit diesen Funktionen können Sie den Zugriff auf Ihre Cluster steuern, Konnektivitätsregeln definieren sowie Daten und Verbindungen verschlüsseln. Diese Funktionen ergänzen die Datenbankzugriffs- und Sicherheitsfunktionen in Amazon Redshift. Weitere Informationen zum Thema Datenbanksicherheit finden Sie unter Verwalten der Datenbanksicherheit im Datenbankentwicklerhandbuch zu Amazon Redshift.

AWS Konten und IAM-Anmeldeinformationen

Standardmäßig ist ein Amazon Redshift Redshift-Cluster nur für das AWS Konto zugänglich, das den Cluster erstellt. Der Cluster wird für den Zugriff durch andere Benutzer gesperrt. In Ihrem AWS Konto verwenden Sie den AWS Identity and Access Management (IAM) -Service, um Benutzerkonten zu erstellen und die Berechtigungen für diese Konten zur Steuerung des Clusterbetriebs zu verwalten. Weitere Informationen finden Sie unter Sicherheit in Amazon Redshift. Weitere Informationen zur Verwaltung von IAM-Identitäten, einschließlich Leitlinien und bewährten Methoden für IAM-Rollen, finden Sie unter Identity and Access Management in Amazon Redshift.

Sicherheitsgruppen

Standardmäßig ist jeder von Ihnen erstellte Cluster für alle gesperrt. Mit den IAM-Anmeldeinformationen wird lediglich der Zugriff auf Amazon Redshift API-bezogene Ressourcen gesteuert: die Amazon-Redshift-Konsole, die Befehlszeilenschnittstelle (CLI), die API und das SDK. Zur Steuerung des Zugriffs auf den Cluster über SQL-Client-Tools über JDBC oder ODBC werden Sicherheitsgruppen verwendet:

  • Wenn Sie für Ihren Amazon-Redshift-Cluster die EC2-VPC-Plattform nutzen, müssen Sie VPC-Sicherheitsgruppen verwenden. Wir empfehlen, Ihren Cluster auf einer EC2-VPC-Plattform zu starten.

    Sie können einen Cluster nicht zu einer VPC verschieben, nachdem er mit EC2-Classic gestartet wurde. Sie können mit der Amazon-Redshift-Konsole jedoch einen EC2-Classic-Snapshot auf einen EC2-VPC-Cluster wiederherstellen. Weitere Informationen finden Sie unter Wiederherstellen eines Clusters aus einem Snapshot.

  • Wenn Sie für Ihren Amazon-Redshift-Cluster die EC2-Classic-Plattform nutzen, müssen Sie Amazon-Redshift-Sicherheitsgruppen verwenden.

Sie müssen in beiden Fällen Regeln zur Sicherheitsgruppe hinzufügen, um explizit eingehenden Zugriff auf einen bestimmten Bereich von CIDR/IP-Adressen bzw. auf eine Amazon Elastic Compute Cloud (EC2)-Sicherheitsgruppe zu gewähren, falls Ihr SQL-Client auf einer Amazon-EC2-Instance ausgeführt wird. Weitere Informationen finden Sie unter Amazon-Redshift-Cluster-Sicherheitsgruppen.

Außer den eingehenden Zugriffsregeln müssen Sie auch Datenbankbenutzer anlegen, mit deren Anmeldeinformationen eine Authentifizierung an der Datenbank in dem Cluster selbst durchgeführt werden kann. Weitere Informationen finden Sie unter Datenbanken in diesem Thema.

Verschlüsselung

Wenn Sie den Cluster bereitstellen, können Sie ihn optional verschlüsseln und auf diese Weise zusätzlich schützen. Wenn die Verschlüsselung aktiviert ist, speichert Amazon Redshift alle Daten in vom Benutzern erstellten Tabellen in verschlüsselter Form. Sie können AWS Key Management Service (AWS KMS) zur Verwaltung Ihrer Verschlüsselungsschlüssel für Amazon Redshift verwenden.

Verschlüsselung ist eine unveränderliche Eigenschaft eines Clusters. Die einzige Möglichkeit, von einem verschlüsselten Cluster zu einem nicht verschlüsselten Cluster zu wechseln, besteht darin, die Daten zu entladen und in einen neuen Cluster neu zu laden. Die Verschlüsselung gilt für den Cluster selbst sowie für alle Sicherungen. Wenn Sie einen Cluster aus einem verschlüsselten Snapshot wiederherstellen, wird auch der wiederhergestellte Cluster verschlüsselt.

Weitere Informationen zu Verschlüsselung in Hardwaresicherheitsmodulen finden Sie unter Verschlüsselung von Amazon-Redshift-Datenbanken.

SSL-Verbindungen

Wenn Sie die Verbindung zwischen Ihrem SQL-Client und Ihrem Cluster verschlüsseln möchten, können Sie eine verschlüsselte Secure Sockets Layer (SSL)-Verbindung verwenden. Weitere Informationen finden Sie unter Konfigurieren von Sicherheitsoptionen für Verbindungen.

Überwachung von Clustern

Es gibt in Amazon Redshift mehrere Funktionen zur Überwachung. Sie können die Datenbankprüfungs–Protokollierung verwenden, um Aktivitätsprotokolle zu erstellen und Ereignisse und Benachrichtigungsabonnements zu konfigurieren, um interessante Informationen zu verfolgen. Verwenden Sie die Metriken in Amazon Redshift und Amazon CloudWatch , um mehr über den Zustand und die Leistung Ihrer Cluster und Datenbanken zu erfahren.

Datenbank-Prüfungsprotokollierung

Sie können die Datenbank-Auditprotokollierung verwenden, um Informationen zu Authentifizierungsversuchen, Verbindungen, Verbindungstrennungen, Änderungen bezüglich der Definition der Datenbankbenutzer und in der Datenbank ausgeführten Abfragen zu erhalten. Diese Informationen können zu Sicherheits- und Fehlerbehebungszwecken in Amazon Redshift nützlich sein. Die Protokolle werden in Amazon-S3-Buckets gespeichert. Weitere Informationen finden Sie unter Datenbank-Prüfungsprotokollierung.

Ereignisse und Benachrichtigungen

Amazon Redshift verfolgt Ereignisse und speichert Informationen über sie für einen Zeitraum von mehreren Wochen in Ihrem AWS Konto. Amazon Redshift meldet bei jedem Ereignis Informationen wie Datum und Uhrzeit, zu denen das Ereignis auftrat, eine Beschreibung, die Ereignisquelle (z. B. ein Cluster, eine Parametergruppe oder ein Snapshot) und die Quell-ID. Sie können Abonnements für Amazon-Redshift-Ereignisbenachrichtigungen erstellen, die eine Gruppe von Ereignisfiltern angeben. Wenn ein Ereignis eintritt, das den Filterkriterien entspricht, nutzt Amazon Redshift Amazon Simple Notification Service, um Sie über das Eintreten des Ereignisses zu informieren. Weitere Informationen zu Ereignissen und Benachrichtigungen finden Sie unter Amazon-Redshift-Ereignisse.

Leistung

Amazon Redshift stellt Leistungsmetriken und Daten bereit, mit denen Sie den Zustand und die Leistung Ihrer Cluster und Datenbanken überwachen können. Amazon Redshift verwendet CloudWatch Amazon-Metriken, um die physischen Aspekte des Clusters wie CPU-Auslastung, Latenz und Durchsatz zu überwachen. Amazon Redshift bietet außerdem Abfrage- und Ladeleistungsdaten, mit denen Sie die Datenbankaktivität in Ihrem Cluster überwachen können. Weitere Informationen zu Leistungsmetriken und -überwachung finden Sie unter Überwachen der Amazon-Redshift-Cluster-Leistung.

Datenbanken

Amazon Redshift erstellt eine einzige Datenbank, wenn Sie einen Cluster bereitstellen. Diese Datenbank wird verwendet, um Daten zu laden und Abfragen für Ihre Daten auszuführen. Sie können natürlich bei Bedarf weitere Datenbanken hinzufügen, indem Sie einen geeigneten SQL-Befehl ausführen. Weitere Informationen zum Erstellen weiterer Datenbanken finden Sie unter Schritt 1: Erstellen einer Datenbank im Datenbankentwicklerhandbuch zu Amazon Redshift.

Wenn Sie einen Cluster bereitstellen, geben Sie ein Administratorkonto an, das Zugriff auf alle Datenbanken hat, die in dem Cluster erstellt werden. Dieser Administrator ist ein Superuser und zunächst der einzige Benutzer, der auf die Datenbank zugreifen darf. Dieser Masterbenutzer darf dann weitere Superuser und Benutzer anlegen. Weitere Informationen finden Sie unter Superuser und Benutzer im Datenbankentwicklerhandbuch zu Amazon Redshift.

Amazon Redshift legt das Verhalten (z. B. das Anzeigeformat für Datumsangaben oder die Genauigkeit für Fließkommaberechnungen) für alle Datenbanken in einem Cluster über Parametergruppen fest. Wenn Sie bei der Bereitstellung Ihres Clusters kein Parametergruppe angeben, ordnet Amazon Redshift dem Cluster eine Standardparametergruppe zu. Weitere Informationen finden Sie unter Amazon-Redshift-Parametergruppen.

Weitere Informationen über Datenbanken in Amazon Redshift finden Sie im Datenbankentwicklerhandbuch zu Amazon Redshift.