Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenaustausch in Amazon Redshift
Mit Amazon Redshift können Sie Daten sicher zwischen Amazon Redshift Redshift-Clustern oder mit anderen AWS Services teilen. Durch die gemeinsame Nutzung von Daten können Sie Live-Daten teilen, ohne sie kopieren oder verschieben zu müssen. Datenbankadministratoren und Dateningenieure können Data Sharing nutzen, um sicheren, schreibgeschützten Zugriff auf Daten zu Analysezwecken zu ermöglichen und gleichzeitig die Kontrolle über die Daten zu behalten. Datenanalysten, Business Intelligence-Experten und Datenwissenschaftler können gemeinsam genutzte Daten nutzen, um Erkenntnisse zu gewinnen, ohne Daten duplizieren oder verschieben zu müssen. Zu den häufigsten Anwendungsfällen gehören die gemeinsame Nutzung von Daten mit Partnern, die Durchführung funktionsübergreifender Analysen und die Erleichterung der Datendemokratisierung innerhalb eines Unternehmens. In den folgenden Abschnitten werden die Einzelheiten der Konfiguration und Verwaltung der gemeinsamen Nutzung von Daten in Amazon Redshift behandelt.
Mit Amazon Redshift Data Sharing können Sie den Zugriff auf Live-Daten sicher über Amazon Redshift Redshift-Cluster und Arbeitsgruppen hinweg teilen AWS-Konten, AWS-Regionen ohne die Daten manuell verschieben oder kopieren zu müssen. Da die Daten live sind, können alle Benutzer die meisten up-to-date und konsistentesten Informationen in Amazon Redshift sehen, sobald sie aktualisiert sind.
Sie können Daten für mehrere bereitgestellte Cluster, Serverless-Arbeitsgruppen, Availability Zones, AWS-Konten und AWS-Regionen freigeben. Die Daten können zwischen Cluster-Typen sowie zwischen bereitgestellten Clustern und Serverless geteilt werden.
Sie können Datenbankobjekte sowohl für Lese- als auch für Schreibvorgänge in verschiedenen Amazon Redshift-Clustern oder Amazon Redshift Serverless-Arbeitsgruppen innerhalb derselben AWS-Konto oder von einer zur anderen gemeinsam nutzen. AWS-Konto Sie können Daten auch regionsübergreifend lesen und schreiben. Sie können Berechtigungen wie SELECT, INSERT und UPDATE für verschiedene Tabellen und USAGE und CREATE für verschiedene Schemata gewähren. Die Daten sind live und für alle Warehouses verfügbar, sobald eine Schreibtransaktion festgeschrieben wurde.
Anwendungsfälle für Datenfreigabe mit Amazon Redshift
Die Amazon-Redshift-Datenfreigabe ist besonders für folgende Anwendungsfälle nützlich:
-
Unterstützung verschiedener Arten geschäftskritischer Workloads – Verwenden Sie einen zentralen Extract, Transform, Load (ETL)-Cluster, der Daten mit mehreren Business Intelligence (BI) oder Analyse-Clustern gemeinsam verwendet. Dieser Ansatz bietet Lese-Workload-Isolation und Rückbelastung für einzelne Workloads. Sie können Ihre individuelle Workload-Rechenleistung entsprechend den Workload-spezifischen Preis- und Leistungsanforderungen anpassen und skalieren.
-
Gruppenübergreifende Zusammenarbeit – Ermöglicht nahtlose Zusammenarbeit zwischen Teams und Unternehmensgruppen für umfassendere Analysen, Datenwissenschaft und produktübergreifende Wirkungsanalysen.
-
Bereitstellung von Daten als Service – Teilen Sie Daten als Service in Ihrer gesamten Organisation.
-
Freigabe von Daten zwischen Umgebungen – Teilen Sie Daten in Entwicklungs-, Test- und Produktionsumgebungen. Sie können die Teamagilität verbessern, indem Sie Daten auf verschiedenen Granularitätsstufen teilen.
-
Lizenzierung des Zugriffs auf Daten in Amazon Redshift — Listet Amazon Redshift Redshift-Datensätze im AWS Data Exchange Katalog auf, die Kunden innerhalb von Minuten finden, abonnieren und abfragen können.
Anwendungsfälle für die gemeinsame Nutzung von Daten und Schreibzugriff
Für die gemeinsame Nutzung von Daten bei Schreibvorgängen gibt es mehrere wichtige Anwendungsfälle:
-
Geschäftsquellendaten auf dem Hersteller aktualisieren — Sie können Daten als Service unternehmensweit gemeinsam nutzen, aber Verbraucher können dann auch Aktionen mit den Quelldaten durchführen. Sie können beispielsweise up-to-date Rückwerte mitteilen oder den Empfang von Daten bestätigen. Dies sind nur einige mögliche Geschäftsanwendungsfälle.
-
Fügen Sie zusätzliche Datensätze zum Hersteller hinzu — Verbraucher können den ursprünglichen Quelldaten Datensätze hinzufügen. Diese können bei Bedarf als vom Verbraucher stammend gekennzeichnet werden.
Informationen speziell dazu, wie Schreibvorgänge auf einer Datenfreigabe ausgeführt werden, finden Sie unter Teilen des Schreibzugriffs auf Daten.
Datenaustausch auf verschiedenen Ebenen in Amazon Redshift
Mit Amazon Redshift können Sie Daten auf verschiedenen Ebenen teilen. Zu diesen Ebenen gehören Datenbanken, Schemas, Tabellen, Ansichten (einschließlich regulärer Ansichten, Late-Binding-Ansichten und materialisierter Ansichten) und benutzerdefinierte SQL-Funktionen (). UDFs Sie können mehrere Datashares für eine bestimmte Datenbank erstellen. Ein Datashare kann Objekte aus mehreren Schemas in der Datenbank enthalten, für die eine Freigabe erfolgt.
Durch diese Flexibilität beim Teilen von Daten erhalten Sie eine differenzierte Zugriffskontrolle. Sie können dieses Steuerelement für verschiedene Benutzer und Unternehmen anpassen, die Zugriff auf Amazon-Redshift-Daten benötigen.
Konsistenzmanagement für die gemeinsame Nutzung von Daten in Amazon Redshift
Amazon Redshift bietet Transaktionskonsistenz auf allen Produzenten- und Verbraucherclustern und teilt up-to-date und konsistente Ansichten der Daten mit allen Verbrauchern.
Sie können Daten im Produzenten-Cluster kontinuierlich aktualisieren. Alle Abfragen in einem Konsumenten-Cluster innerhalb einer Transaktion lesen den gleichen Status der freigegebenen Daten. Amazon Redshift berücksichtigt nicht die Daten, die durch eine andere Transaktion im Produzenten-Cluster geändert wurden, die nach dem Beginn der Transaktion im Konsumenten-Cluster festgeschrieben wurden. Nachdem die Datenänderung im Produzenten-Cluster festgeschrieben wurde, können neue Transaktionen im Konsumenten-Cluster die aktualisierten Daten sofort abfragen.
Durch die starke Konsistenz werden die Risiken von Geschäftsberichten mit niedrigerer Detailtreue entfernt, die während der Freigabe von Daten möglicherweise ungültige Ergebnisse enthalten. Dieser Faktor ist besonders wichtig für Finanzanalysen oder wo die Ergebnisse verwendet werden könnten, um Datensätze vorzubereiten, die zum Trainieren von Modellen für Machine Learning verwendet werden.