Aktivieren der Verdichtung - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aktivieren der Verdichtung

Sie können Lake Formation Console, AWS Glue Console oder verwenden AWS CLI, AWS API um die Komprimierung für Ihre Apache Iceberg-Tabellen im AWS Glue Datenkatalog zu aktivieren. Für neue Tabellen können Sie Apache Iceberg als Tabellenformat auswählen und die Verdichtung beim Erstellen der Tabellen aktivieren. Für neue Tabellen ist die Verdichtung standardmäßig deaktiviert.

Console
Aktivieren der Verdichtung
  1. Öffnen Sie die AWS Glue Konsole unter https://console.aws.amazon.com/glue/und melden Sie sich als Data Lake-Administrator, als Tabellenersteller oder als Benutzer an, dem die lakeformation:GetDataAccess Berechtigungen glue:UpdateTable und für die Tabelle erteilt wurden.

  2. Wählen Sie im Navigationsbereich unter Datenkatalog die Option Tabellen aus.

  3. Wählen Sie auf der Seite Tabellen eine Tabelle im offenen Tabellenformat aus, für die Sie die Verdichtung aktivieren möchten, und wählen Sie dann im Menü Aktionen die Option Verdichtung aktivieren aus.

  4. Sie können die Verdichtung auch aktivieren, indem Sie die Tabelle auswählen und die Seite mit den Tabellendetails öffnen. Wählen Sie im unteren Bereich der Seite die Registerkarte Tabellenoptimierung und dann Verdichtung aktivieren aus.

  5. Wählen Sie auf der Seite „Komprimierung aktivieren“ aus der IAMDropdownliste eine Rolle aus, um die Komprimierung auszuführen.

    Die IAM Rolle muss über die im Abschnitt angegebenen Berechtigungen verfügen. Voraussetzungen für die Tabellenoptimierung

    Sie können auch die Option Neue IAM Rolle erstellen wählen, um eine benutzerdefinierte Rolle mit den erforderlichen Berechtigungen zum Ausführen der Komprimierung zu erstellen.

    Gehen Sie wie folgt vor, um eine bestehende IAM Rolle zu aktualisieren:

    1. Um die Berechtigungsrichtlinie für die IAM Rolle zu aktualisieren, wechseln Sie in der IAM Konsole zu der IAM Rolle, die für die Ausführung der Komprimierung verwendet wird.

    2. Wählen Sie im Abschnitt Berechtigungen hinzufügen die Option Richtlinie erstellen aus. Erstellen Sie im neu geöffneten Browserfenster eine neue Richtlinie, die Sie mit Ihrer Rolle verwenden möchten.

    3. Wählen Sie auf der Seite „Richtlinie erstellenJSON“ die Registerkarte aus. Kopieren Sie den JSON unter Voraussetzungen angezeigten Code in das Feld Richtlinien-Editor.

  6. Wählen Sie Absenden aus.

AWS CLI

Im folgenden Beispiel wird gezeigt, wie Sie die Verdichtung aktivieren. Ersetzen Sie die Konto-ID durch eine gültige AWS Konto-ID. Ersetzen Sie den Datenbanknamen und den Tabellennamen durch die tatsächlichen Tabellen- und Datenbanknamen in Iceberg. Ersetzen Sie das roleArn durch den AWS Ressourcennamen (ARN) der IAM Rolle und den Namen der IAM Rolle, die über die erforderlichen Berechtigungen zum Ausführen der Komprimierung verfügt.

aws glue create-table-optimizer \ --catalog-id 123456789012 \ --database-name iceberg_db \ --table-name iceberg_table \ --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'true'}' \ --type compaction
AWS API

Rufen Sie die Operation CreateTableOptimizer auf, um die Verdichtung für eine Tabelle zu aktivieren.

Nachdem Sie die Verdichtung aktiviert haben, werden auf der Registerkarte Tabellenoptimierung die folgenden Verdichtungsdetails angezeigt (nach etwa 15 bis 20 Minuten):

Startzeit

Der Zeitpunkt, zu dem der Verdichtungsvorgang im Datenkatalog gestartet wurde. Der Wert ist ein Zeitstempel. UTC

Endzeit

Der Zeitpunkt, zu dem der Verdichtungsvorgang im Datenkatalog beendet wurde. Der Wert ist ein Zeitstempel. UTC

Status

Der Status des Verdichtungslaufs. Die Werte sind „Erfolgreich“ oder „Fehlgeschlagen“.

Komprimierte Dateien

Gesamtzahl der komprimierten Dateien.

Komprimierte Bytes

Gesamtzahl der komprimierten Byte.