Parameter, die vom Crawler in Data-Catalog-Tabellen festgelegt wurden - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Parameter, die vom Crawler in Data-Catalog-Tabellen festgelegt wurden

Diese Tabelleneigenschaften werden vonAWS Glue-Crawlern festgelegt. Wir erwarten, dass Benutzer die classification- und compressionType-Eigenschaften nutzen. Andere Eigenschaften, einschließlich Schätzungen der Tabellengröße, werden für interne Berechnungen verwendet, und wir übernehmen keine Garantie für deren Richtigkeit oder Anwendbarkeit auf Kundenanwendungsfälle. Das Ändern dieser Parameter kann das Verhalten des Crawlers verändern. Wir unterstützen diesen Workflow nicht.

Eigenschaftsschlüssel Eigenschaftenwert
UPDATED_BY_CRAWLER

Name des Crawlers, der die Aktualisierung durchführt.

connectionName

Der Name der Verbindung im Data Catalog für den Crawler, der zum Herstellen einer Verbindung mit dem Datenspeicher verwendet wird.

recordCount

Schätzen Sie die Anzahl der Datensätze in der Tabelle, basierend auf Dateigrößen und Kopfzeilen.

skip.header.line.count

Zeilen wurden übersprungen, um die Kopfzeile zu überspringen. Wird auf Tabellen gesetzt, die als CSV klassifiziert sind.

CrawlerSchemaSerializerVersion

Zur internen Verwendung

classification

Format der Daten, abgeleitet vom Crawler. Weitere Informationen zu von AWS Glue-Crawlern unterstützten Datenformaten finden Sie unter Integrierte Classifier in AWS Glue.

CrawlerSchemaDeserializerVersion

Zur internen Verwendung

sizeKey

Kombinierte Größe der Dateien in der gecrawlten Tabelle.

averageRecordSize

Durchschnittliche Zeilengröße in der Tabelle, in Bytes.

compressionType

Art der Komprimierung, die für Daten in der Tabelle verwendet wird. Weitere Informationen zu von AWS Glue-Crawlern unterstützten Komprimierungstypen finden Sie unter Integrierte Classifier in AWS Glue.

typeOfData

file, table oder view.

objectCount

Anzahl der Objekte unter dem Amazon-S3-Pfad für die Tabelle.

Diese zusätzlichen Tabelleneigenschaften werden von AWS Glue-Crawlern für Snowflake-Datenspeicher festgelegt.

Eigenschaftsschlüssel Eigenschaftenwert
aws:RawTableLastAltered

Zeichnet den letzten geänderten Zeitstempel der Snowflake-Tabelle auf.

ViewOriginalText

Zeigt die SQL-Anweisung an.

ViewExpandedText

Zeigt eine im Base64-Format codierte SQL-Anweisung an.

ExternalTable:S3Location

Amazon-S3-Speicherort der externen Snowflake-Tabelle.

ExternalTable:FileFormat

Amazon S3-Dateiformat der externen Snowflake-Tabelle.

Diese zusätzlichen Tabelleneigenschaften werden von AWS Glue-Crawlern für JDBC-Datenspeicher wie Amazon Redshift, Microsoft SQL Server, MySQL, PostgreSQL und Oracle festgelegt.

Eigenschaftsschlüssel Eigenschaftenwert
aws:RawType

Wenn ein Crawler die Daten im Data Catalog speichert, übersetzt er die Datentypen in Hive-kompatible Typen, was häufig dazu führt, dass die Informationen zum nativen Datentyp verloren gehen. Der Crawler gibt den aws:RawType-Parameter aus, um den Datentyp auf nativer Ebene bereitzustellen.

aws:RawColumnComment

Wenn einer Spalte in der Datenbank ein Kommentar zugeordnet ist, gibt der Crawler den entsprechenden Kommentar in der Katalogtabelle aus. Die Kommentarzeichenfolge wird auf 255 Byte gekürzt.

Kommentare werden für Microsoft SQL Server nicht unterstützt.

aws:RawTableComment

Wenn einer Tabelle in der Datenbank ein Kommentar zugeordnet ist, gibt der Crawler den entsprechenden Kommentar in der Katalogtabelle aus. Die Kommentarzeichenfolge wird auf 255 Byte gekürzt.

Kommentare werden für Microsoft SQL Server nicht unterstützt.