Amazon-Redshift-Verwaltungsübersicht - Amazon Redshift

Amazon-Redshift-Verwaltungsübersicht

Der Amazon-Redshift-Service verwaltet alle Arbeiten zur Einrichtung, zum Betrieb und zum Skalieren eines Data Warehouse. Zu diesen Aufgaben gehören auch die Bereitstellung von Kapazitäten, die Überwachung und das Sichern des Clusters sowie das Anwenden von Patches und Upgrades auf die Amazon-Redshift-Engine.

Clusterverwaltung

Ein Amazon-Redshift-Cluster besteht aus einer Reihe von Knoten, darunter einem Führungsknoten und einem oder mehreren Rechenknoten. Die Anzahl und die Art der benötigten Verarbeitungsknoten hängt von Ihrer Datenvolumen, der Anzahl der auszuführenden Abfragen und der benötigten Leistung bei der Ausführung der Abfragen ab.

Erstellen und Verwalten von Clustern

Sie können, je nach Anforderungen an Ihr Data Warehouse, zunächst mit einem kleinen Cluster mit einem Arbeitsknoten beginnen, bei Bedarf jedoch problemlos die Anzahl der Knoten in dem Cluster beliebig hochskalieren, wenn sich Ihre Anforderungen ändern. Sie können einem Cluster im laufenden Betrieb Verarbeitungsknoten hinzufügen und entfernen. Weitere Informationen finden Sie unter Amazon-Redshift-Cluster.

Reservieren von Datenverarbeitungsknoten

Wenn Sie planen, Ihren Cluster ein ganzes Jahr und länger zu betrieben, können Sie Geld sparen, indem Sie Knoten für einen Zeitraum von 1 oder 3 Jahren reservieren. Das Reservieren von Verarbeitungsknoten ist deutlich preisgünstiger als die Stundensätze, die anfallen, wenn Sie Verarbeitungsknoten auf Anfrage bereitstellen. Weitere Informationen finden Sie unter Kaufen reservierter Amazon-Redshift-Knoten.

Erstellen von Cluster-Snapshots

Snapshots sind Sicherungen eines Clusters in Form einer Momentaufnahme. Es gibt zwei Arten von Snapshots: automatisierte und manuelle. Amazon Redshift speichert diese Snapshots intern in Amazon Simple Storage Service (Amazon S3) unter Verwendung einer verschlüsselten Secure Sockets Layer (SSL)-Verbindung. Wenn Sie einen Cluster anhand eines Snapshots wiederherstellen müssen, erstellt Amazon Redshift einen neuen Cluster und importiert dann die Daten aus dem von Ihnen angegebenen Snapshot. Weitere Informationen zu -Snapshots finden Sie unter Amazon-Redshift-Snapshots.

Zugriff und Sicherheit bei Clustern

Es gibt in Amazon Redshift mehrere Funktionen für den Zugriff auf und die Sicherheit von Clustern. Mit diesen Funktionen können Sie den Zugriff auf Ihre Cluster steuern, Konnektivitätsregeln definieren sowie Daten und Verbindungen verschlüsseln. Diese Funktionen ergänzen die Datenbankzugriffs- und Sicherheitsfunktionen in Amazon Redshift. Weitere Informationen zum Thema Datenbanksicherheit finden Sie unter Verwalten der Datenbanksicherheit im Datenbankentwicklerhandbuch zu Amazon Redshift.

AWS-Konten und IAM-Anmeldeinformationen

Standardmäßig ist der Zugriff auf einen Amazon-Redshift-Cluster nur über das AWS-Konto möglich, das den Cluster erstellt hat. Der Cluster wird für den Zugriff durch andere Benutzer gesperrt. Sie können in Ihrem AWS-Konto mit dem AWS Identity and Access Management (IAM)-Service Benutzerkonten erstellen und Berechtigungen für diese Konten verwalten, um Cluster-Vorgänge zu steuern. Weitere Informationen finden Sie unter Sicherheit in Amazon Redshift.

Sicherheitsgruppen

Standardmäßig ist jeder von Ihnen erstellte Cluster für alle gesperrt. Mit den IAM-Anmeldeinformationen wird lediglich der Zugriff auf Amazon Redshift API-bezogene Ressourcen gesteuert: die Amazon-Redshift-Konsole, die Befehlszeilenschnittstelle (CLI), die API und das SDK. Zur Steuerung des Zugriffs auf den Cluster über SQL-Client-Tools über JDBC oder ODBC werden Sicherheitsgruppen verwendet:

  • Wenn Sie für Ihren Amazon-Redshift-Cluster die EC2-VPC-Plattform nutzen, müssen Sie VPC-Sicherheitsgruppen verwenden. Wir empfehlen, Ihren Cluster auf einer EC2-VPC-Plattform zu starten.

    Sie können einen Cluster nicht zu einer VPC verschieben, nachdem er mit EC2-Classic gestartet wurde. Sie können mit der Amazon-Redshift-Konsole jedoch einen EC2-Classic-Snapshot auf einen EC2-VPC-Cluster wiederherstellen. Weitere Informationen finden Sie unter Wiederherstellen eines Clusters aus einem Snapshot.

  • Wenn Sie für Ihren Amazon-Redshift-Cluster die EC2-Classic-Plattform nutzen, müssen Sie Amazon-Redshift-Sicherheitsgruppen verwenden.

Sie müssen in beiden Fällen Regeln zur Sicherheitsgruppe hinzufügen, um explizit eingehenden Zugriff auf einen bestimmten Bereich von CIDR/IP-Adressen bzw. auf eine Amazon Elastic Compute Cloud (EC2)-Sicherheitsgruppe zu gewähren, falls Ihr SQL-Client auf einer Amazon-EC2-Instance ausgeführt wird. Weitere Informationen finden Sie unter Amazon-Redshift-Cluster-Sicherheitsgruppen.

Außer den eingehenden Zugriffsregeln müssen Sie auch Datenbankbenutzer anlegen, mit deren Anmeldeinformationen eine Authentifizierung an der Datenbank in dem Cluster selbst durchgeführt werden kann. Weitere Informationen finden Sie unter Databases in diesem Thema.

Encryption

Wenn Sie den Cluster bereitstellen, können Sie ihn optional verschlüsseln und auf diese Weise zusätzlich schützen. Wenn die Verschlüsselung aktiviert ist, speichert Amazon Redshift alle Daten in vom Benutzern erstellten Tabellen in verschlüsselter Form. Sie können AWS Key Management Service (AWS KMS) zur Verwaltung Ihrer Verschlüsselungsschlüssel für Amazon Redshift verwenden.

Verschlüsselung ist eine unveränderliche Eigenschaft eines Clusters. Die einzige Möglichkeit, von einem verschlüsselten Cluster zu einem nicht verschlüsselten Cluster zu wechseln, besteht darin, die Daten zu entladen und in einen neuen Cluster neu zu laden. Die Verschlüsselung gilt für den Cluster selbst sowie für alle Sicherungen. Wenn Sie einen Cluster aus einem verschlüsselten Snapshot wiederherstellen, wird auch der wiederhergestellte Cluster verschlüsselt.

Weitere Informationen zu Verschlüsselung in Hardwaresicherheitsmodulen finden Sie unter Verschlüsselung von Amazon-Redshift-Datenbanken.

SSL-Verbindungen

Wenn Sie die Verbindung zwischen Ihrem SQL-Client und Ihrem Cluster verschlüsseln möchten, können Sie eine verschlüsselte Secure Sockets Layer (SSL)-Verbindung verwenden. Weitere Informationen finden Sie unter Konfigurieren von Sicherheitsoptionen für Verbindungen.

Überwachung von Clustern

Es gibt in Amazon Redshift mehrere Funktionen zur Überwachung. Sie können die Datenbank-Prüfprotokolle verwenden, um Aktivitätsprotokolle zu erstellen, Ereignisse und Benachrichtigungsabonnements zu konfigurieren, um interessante Informationen zu verfolgen. Verwenden Sie die Metriken in Amazon Redshift und Amazon CloudWatch, um mehr über den Status und die Leistung Ihrer Cluster und Datenbanken zu erfahren.

Datenbank-Prüfungsprotokollierung

Sie können die Datenbank-Auditprotokollierung verwenden, um Informationen zu Authentifizierungsversuchen, Verbindungen, Verbindungstrennungen, Änderungen bezüglich der Definition der Datenbankbenutzer und in der Datenbank ausgeführten Abfragen zu erhalten. Diese Informationen können zu Sicherheits- und Fehlerbehebungszwecken in Amazon Redshift nützlich sein. Die Protokolle werden in Amazon-S3-Buckets gespeichert. Weitere Informationen finden Sie unter Datenbank-Prüfungsprotokollierung.

Ereignisse und Benachrichtigungen

Amazon Redshift verfolgt Ereignisse nach und speichert Informationen zu ihnen für einen Zeitraum von mehreren Wochen in Ihrem AWS-Konto. Amazon Redshift meldet bei jedem Ereignis Informationen wie Datum und Uhrzeit, zu denen das Ereignis auftrat, eine Beschreibung, die Ereignisquelle (z. B. ein Cluster, eine Parametergruppe oder ein Snapshot) und die Quell-ID. Sie können Abonnements für Amazon-Redshift-Ereignisbenachrichtigungen erstellen, die eine Gruppe von Ereignisfiltern angeben. Wenn ein Ereignis auftritt, das den Filterkriterien entspricht, nutzt Amazon Redshift Amazon Simple Notification Service, um Sie aktiv über das Auftreten des Ereignisses zu informieren. Weitere Informationen zu Ereignissen und Benachrichtigungen finden Sie unter Amazon-Redshift-Ereignisse.

Performance

Amazon Redshift stellt Leistungsmetriken und Daten bereit, mit denen Sie den Zustand und die Leistung Ihrer Cluster und Datenbanken überwachen können. Amazon Redshift verwendet Amazon-CloudWatch-Metriken, um die physischen Aspekte des Clusters, wie CPU-Nutzung, Latenz und Durchsatz, zu überwachen. Amazon Redshift bietet außerdem Abfrage- und Ladeleistungsdaten, mit denen Sie die Datenbankaktivität in Ihrem Cluster überwachen können. Weitere Informationen zu Leistungsmetriken und -überwachung finden Sie unter Überwachen der Amazon-Redshift-Cluster-Leistung.

Databases

Amazon Redshift erstellt eine einzige Datenbank, wenn Sie einen Cluster bereitstellen. Diese Datenbank wird verwendet, um Daten zu laden und Abfragen über den Daten auszuführen. Sie können natürlich bei Bedarf weitere Datenbanken hinzufügen, indem Sie einen geeigneten SQL-Befehl ausführen. Weitere Informationen zum Erstellen weiterer Datenbanken finden Sie unter Schritt 1: Erstellen einer Datenbank im Datenbankentwicklerhandbuch zu Amazon Redshift.

Wenn Sie einen Cluster bereitstellen, geben Sie ein Administratorkonto an, das Zugriff auf alle Datenbanken hat, die in dem Cluster erstellt werden. Dieser Administrator ist ein Superuser und zunächst der einzige Benutzer, der auf die Datenbank zugreifen darf. Dieser Masterbenutzer darf dann weitere Superuser und Benutzer anlegen. Weitere Informationen finden Sie unter Superuser und Benutzer im Datenbankentwicklerhandbuch zu Amazon Redshift.

Amazon Redshift legt das Verhalten (z. B. das Anzeigeformat für Datumsangaben oder die Genauigkeit für Fließkommaberechnungen) für alle Datenbanken in einem Cluster über Parametergruppen fest. Wenn Sie bei der Bereitstellung Ihres Clusters kein Parametergruppe angeben, ordnet Amazon Redshift dem Cluster eine Standardparametergruppe zu. Weitere Informationen finden Sie unter Amazon-Redshift-Parametergruppen.

Weitere Informationen über Datenbanken in Amazon Redshift finden Sie im Datenbankentwicklerhandbuch zu Amazon Redshift.