Generieren von Spaltenstatistiken für Iceberg-Tabellen - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Generieren von Spaltenstatistiken für Iceberg-Tabellen

Gehen Sie wie folgt vor, um einen Zeitplan für die Generierung von Statistiken im Datenkatalog zu konfigurieren. Verwenden Sie dazu die AWS Glue Konsole AWS CLI oder führen Sie den StartColumnStatisticsTaskRunVorgang aus.

Um Spaltenstatistiken zu generieren
  1. Melden Sie sich unter https://console.aws.amazon.com/glue/ bei der AWS Glue Konsole an.

  2. Wählen Sie unter Datenkatalog die Option Tabellen aus.

  3. Wählen Sie eine Iceberg-Tabelle aus der Liste aus.

  4. Wählen Sie im Menü Aktionen die Option Spaltenstatistiken, Auf Abruf generieren aus.

    Sie können auch im unteren Bereich der Seite Tabellen auf der Registerkarte Spaltenstatistiken die Schaltfläche Statistik generieren auswählen.

  5. Geben Sie auf der Seite Statistiken generieren die Details zur Statistikgenerierung an. Folgen Sie den Schritten 5 bis 7 im Generieren von Spaltenstatistiken Abschnitt, um die Statistikgenerierung für Iceberg-Tabellen zu konfigurieren.

    Anmerkung

    Die Sampling-Option ist für Iceberg-Tabellen nicht verfügbar.

    AWS Glue berechnet die Anzahl der unterschiedlichen Werte für jede Spalte der Iceberg-Tabelle in einer neuen Puffin-Datei, die an die angegebene Snapshot-ID an Ihrem Amazon S3-Standort übergeben wurde.