So geben Sie Konfigurationsoptionen für einen Delta Lake-Datenspeicher an - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So geben Sie Konfigurationsoptionen für einen Delta Lake-Datenspeicher an

Wenn Sie einen Crawler für einen Delta Lake-Datenspeicher konfigurieren, geben Sie diese Konfigurationsparameter an:

Verbindung

Wählen oder fügen Sie optional eine Netzwerkverbindung hinzu, die mit diesem Amazon S3-Ziel verwendet werden soll. Weitere Informationen zu Verbindungen finden Sie unter Herstellen einer Verbindung zu Daten.

Tabellen für Abfragen erstellen

Wählen Sie aus, wie Sie die Delta-Lake-Tabellen erstellen möchten:

  • Erstellen nativer Tabellen: Ermöglicht die Integration mit Abfragemodulen, die die direkte Abfrage des Delta-Transaktionsprotokolls unterstützen.

  • Erstellen von Symlink-Tabellen: Erstellen Sie basierend auf den angegebenen Konfigurationsparametern einen Symlink-Manifest-Ordner mit Manifest-Dateien, die durch die Partitionsschlüssel partitioniert sind.

Schreibmanifest aktivieren (nur konfigurierbar, wenn Sie Symlink-Tabellen für eine Delta-Lake-Quelle erstellen ausgewählt haben)

Wählen Sie aus, ob Tabellen-Metadaten oder Schemaänderungen im Delta Lake-Transaktionsprotokoll erkannt werden sollen; es generiert die Manifestdatei neu. Sie sollten diese Option nicht wählen, wenn Sie ein automatisches Manifest-Update mit Delta Lake SET TBLPROPERTIES konfiguriert haben.

Einschließen von Delta Lake-Tabellenpfad(en)

Geben Sie einen oder mehrere Amazon S3-Pfade zu Delta-Tabellen als s3://Bucket/Präfix/Objekt an.

Festlegen des Crawlings eines Delta Lake-Datenspeichers.