Wann sollte die Replikation von S3-Tabellen verwendet werden Features

S3-Tabellen replizieren

Amazon S3 S3-Tabellen unterstützen die automatische Replikation von Apache Iceberg-Tabellen, die in Amazon S3 S3-Tabellen-Buckets gespeichert sind. Replikationsziele können sich in derselben AWS Region, in mehreren AWS Regionen, im selben Konto oder in anderen AWS Konten befinden. Indem Sie die Replikation für Ihre Tabellen konfigurieren, können Sie schreibgeschützte Replikate Ihrer Daten an mehreren Standorten verwalten. Sie können Replikate verwenden, um die Datenverfügbarkeit zu verbessern, Compliance-Anforderungen zu erfüllen und die Zugriffsleistung für verteilte Anwendungen zu erhöhen.

Die Replikation von S3-Tabellen gewährleistet die Datenkonsistenz, indem alle Tabellenaktualisierungen, einschließlich Snapshots, Metadaten und Datendateien, in derselben Reihenfolge wie in der Quelltabelle in die Zieltabelle übernommen werden.

Wann sollte die Replikation von S3-Tabellen verwendet werden

Sie können die Replikation von S3-Tabellen für folgende Zwecke verwenden:

Latenz minimieren — Wenn sich Ihre Kunden an zwei geografischen Standorten befinden, können Sie die Latenz beim Zugriff auf Tabellen minimieren, indem Sie Read Replicas in AWS Regionen einrichten, die geografisch näher an Ihren Benutzern liegen.
Einhaltung gesetzlicher Vorschriften — Sie können Read Replicas an bestimmten geografischen Standorten oder AWS Konten verwalten, was Ihnen helfen kann, bestimmte regulatorische oder Compliance-Anforderungen zu erfüllen. Sie können den Replizierungszieltabellen-Bucket so konfigurieren, dass Tabellen mit anderen AWS KMS-Schlüsseln als die Quelltabelle verschlüsselt werden.
Zentralisierte Analysen — Wenn Ihre Daten über mehrere AWS Regionen verteilt sind, können Sie regionsspezifische Datensätze in eine zentrale Region replizieren, um vereinheitlichte Berichte, regionsübergreifende Analysen und Modellschulungen für maschinelles Lernen zu ermöglichen. Dadurch entfällt die Notwendigkeit, regionsübergreifende Abfragen durchzuführen oder benutzerdefinierte Datenaggregationspipelines zu erstellen.
Test- und Entwicklungsumgebungen — Sie können Lesereplikate von Produktionstabellen in separaten Tabellen AWS-Konten oder Tabellen-Buckets erstellen, um realistische Testdaten für Entwicklungs- und QA-Teams bereitzustellen. Dadurch werden Test-Workloads von Produktionssystemen isoliert und gleichzeitig sichergestellt, dass Testumgebungen über aktuelle, produktionsähnliche Daten verfügen, ohne dass manuelle Exporte oder Datensynchronisierungsprozesse erforderlich sind.

Features

Die Replikation von S3-Tabellen bietet die folgenden Funktionen.

Schreibgeschützte Replikate für S3-Tabellen

Bei der Replikation von S3-Tabellen werden schreibgeschützte Repliken Ihrer Apache Iceberg-Tabellen in Tabellen-Buckets erstellt. Sie können Replikate unabhängig voneinander mit einer beliebigen Iceberg-kompatiblen Engine abfragen.

Automatisch verwaltete Replikate

Der Replikationsdienst S3 Tables verwaltet automatisch Replikattabellen. Bei der Replikation werden Replikate in der Regel innerhalb von Minuten nach der Aktualisierung der Quelle aktualisiert. S3 Tables überträgt alle Aktualisierungen in derselben Reihenfolge wie die Quelltabelle, um die Konsistenz zu gewährleisten.

Replikation an mehrere Ziele

Sie können dieselbe Tabelle in mehrere Zieltabellen-Buckets replizieren. Replikationsziele können sich innerhalb desselben AWS-Region, mehrerer AWS-Regionen, desselben AWS Kontos oder anderer AWS Konten befinden.

Unabhängige Aufbewahrung von Snapshots

Der Ablauf von Snapshots für Replikattabellen ist unabhängig von der Quelltabelle, sodass Sie bei Bedarf unterschiedliche Aufbewahrungszeiträume für Replikattabellen festlegen können. Sie können Ihre Quelltabelle beispielsweise so konfigurieren, dass Snapshots 30 Tage lang aufbewahrt werden, und gleichzeitig einen Aufbewahrungszeitraum von 90 Tagen für Replikattabellen festlegen. Wenn Sie einen längeren Aufbewahrungszeitraum für Replikate konfigurieren, bleiben Snapshots, die an der Quelle ablaufen, in Replikaten verfügbar und abfragbar. Diese Konfiguration bietet erweiterte Funktionen für Zeitreisen für historische Analysen.

Pflegen Sie Replikattabellen auf kostengünstigeren Speicherebenen

Sie können Zieltabellen-Buckets so konfigurieren, dass sie die Speicherklasse S3 Intelligent-Tiering verwenden, die die Speicherkosten automatisch auf der Grundlage von Zugriffsmustern optimiert, ohne dass die Leistung beeinträchtigt oder der Betriebsaufwand beeinträchtigt wird. S3 Intelligent-Tiering eignet sich gut für Replikattabellen, auf die möglicherweise seltener zugegriffen wird.

Weitere Informationen zur Replikation von S3-Tabellen finden Sie in den folgenden Themen.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Arbeiten mit Apache Iceberg V3

So funktioniert die Replikation von S3-Tabellen