Gängige Datentypen - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Gängige Datentypen

Die gängigen Datentypen beschreiben verschiedene Datentypen, die in AWS Glueüblich sind.

Tag-Struktur

Das Tag Objekt stellt eine Bezeichnung dar, die Sie einer AWS Ressource zuweisen können. Jeder Tag (Markierung) besteht aus einem Schlüssel und einem optionalen Wert, beides können Sie bestimmen.

Weitere Informationen zu Tags und zur Steuerung des Zugriffs auf Ressourcen finden Sie unter AWS Tags in AWS Glue und Spezifizieren von AWS Glue Ressourcen ARNs im Entwicklerhandbuch. AWS Glue

Felder
  • key— UTF -8 Zeichenfolge, nicht weniger als 1 oder mehr als 128 Byte lang.

    Der Tag-Schlüssel. Der Schlüssel ist erforderlich, wenn Sie ein Tag für ein Objekt erstellen. Bei dem Schlüssel wird die Groß-/Kleinschreibung berücksichtigt und er darf nicht das Präfix "aws" enthalten.

  • value— UTF -8 Zeichenfolge, nicht mehr als 256 Byte lang.

    Der Tag-Wert. Der Wert ist optional, wenn Sie ein Tag für ein Objekt erstellen. Bei dem Wert wird die Groß-/Kleinschreibung berücksichtigt und er darf nicht das Präfix "aws" enthalten.

DecimalNumber Struktur

Enthält einen numerischen Wert im Dezimalformat.

Felder
  • UnscaledValueErforderlich: Blob.

    Der nicht skalierte numerische Wert.

  • ScaleErforderlich: Zahl (Ganzzahl).

    Die Skalierung, die bestimmt, wo das Dezimalzeichen im nicht skalierten Wert gesetzt wird.

ErrorDetail Struktur

Enthält Details über einen Fehler.

Felder
  • ErrorCode— UTF -8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Code im Zusammenhang mit diesem Fehler.

  • ErrorMessage – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Meldung mit einer Beschreibung des Fehlers.

PropertyPredicate Struktur

Definiert ein Eigenschaftsprädikat.

Felder
  • Key – Wertzeichenfolge mit einer Länge von nicht mehr als 1 024 Bytes.

    Der Schlüssel der Eigenschaft.

  • Value – Wertzeichenfolge mit einer Länge von nicht mehr als 1 024 Bytes.

    Der Wert der Eigenschaft.

  • Comparator— UTF -8 Zeichenfolge (gültige Werte: EQUALS | | GREATER_THAN | LESS_THAN GREATER_THAN_EQUALS |LESS_THAN_EQUALS).

    Der Vergleichsoperator, mit dem diese Eigenschaft mit anderen verglichen wird.

ResourceUri Struktur

Die Ressourcen URIs für die Funktion.

Felder
  • ResourceType— UTF -8 Zeichenfolge (gültige Werte: JAR | FILE |ARCHIVE).

    Der Ressourcentyp.

  • Uri – Uniform Resource Identifier (uri), nicht weniger als 1 oder mehr als 1024 Bytes lang, passend zum URI address multi-line string pattern.

    Die URI für den Zugriff auf die Ressource.

ColumnStatistics Struktur

Stellt die generierten Statistiken auf Spaltenebene für eine Tabelle oder Partition dar.

Felder
  • ColumnNameErforderlich: UTF -8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Name der Spalte, zu der Statistiken gehören.

  • ColumnTypeErforderlich: Typ-Name, nicht mehr als 20 000 Bytes lang, passend zum Single-line string pattern.

    Der Datentyp der Spalte.

  • AnalyzedTimeErforderlich: Zeitstempel.

    Der Zeitstempel für die Generierung der Spaltenstatistiken.

  • StatisticsDataErforderlich: Ein ColumnStatisticsData-Objekt.

    Ein ColumnStatisticData-Objekt, das die Statistikdatenwerte enthält.

ColumnStatisticsError Struktur

Enthält ein fehlgeschlagenes ColumnStatistics-Objekt und den Grund für den Fehler.

Felder
  • ColumnStatistics – Ein ColumnStatistics-Objekt.

    Die ColumnStatistics der Spalte.

  • Error – Ein ErrorDetail-Objekt.

    Eine Fehlermeldung mit dem Grund für den Fehler eines Vorgangs.

ColumnError Struktur

Enthält den Namen der fehlgeschlagenen Spalte und den Grund für den Fehler.

Felder
  • ColumnName— UTF -8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Spalte, die fehlgeschlagen ist.

  • Error – Ein ErrorDetail-Objekt.

    Eine Fehlermeldung mit dem Grund für den Fehler eines Vorgangs.

ColumnStatisticsData Struktur

Enthält die einzelnen Typen von Spaltenstatistikdaten. Es sollte nur ein Datenobjekt festgelegt und durch das Type-Attribut angegeben werden.

Felder
  • TypeErforderlich: UTF -8 Zeichenfolge (gültige Werte: BOOLEAN | DATE | DECIMAL | | DOUBLE | LONG STRING |BINARY).

    Der Typ der Spaltenstatistikdaten.

  • BooleanColumnStatisticsData – Ein BooleanColumnStatisticsData-Objekt.

    Boolesche Spaltenstatistikdaten.

  • DateColumnStatisticsData – Ein DateColumnStatisticsData-Objekt.

    Datum der Spaltenstatistikdaten.

  • DecimalColumnStatisticsData – Ein DecimalColumnStatisticsData-Objekt.

    Statistikdaten in Dezimalspalten. UnscaledValues Darin befinden sich Base64-kodierte Binärobjekte, die Big-Endian-Darstellungen, also Zweierkomplementdarstellungen des unskalierten Dezimalwerts speichern.

  • DoubleColumnStatisticsData – Ein DoubleColumnStatisticsData-Objekt.

    Double-Spaltenstatistikdaten.

  • LongColumnStatisticsData – Ein LongColumnStatisticsData-Objekt.

    Lange Spaltenstatistikdaten.

  • StringColumnStatisticsData – Ein StringColumnStatisticsData-Objekt.

    Zeichenfolgen-Spaltenstatistikdaten.

  • BinaryColumnStatisticsData – Ein BinaryColumnStatisticsData-Objekt.

    Binäre Spaltenstatistikdaten.

BooleanColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für boolesche Datenspalten unterstützt werden.

Felder
  • NumberOfTruesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der wahren Werte in der Spalte.

  • NumberOfFalsesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der falschen Werte in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

DateColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Zeitstempel-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Zeitstempel.

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Zeitstempel.

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

DecimalColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Festkommazahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Ein DecimalNumber-Objekt.

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Ein DecimalNumber-Objekt.

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

DoubleColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Gleitkommazahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Nummer (doppelt).

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Nummer (doppelt).

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

LongColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Ganzzahl-Datenspalten unterstützt werden.

Felder
  • MinimumValue – Zahl (lang).

    Der niedrigste Wert in der Spalte.

  • MaximumValue – Zahl (lang).

    Der höchste Wert in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

StringColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Zeichenfolge-Datenwerte unterstützt werden.

Felder
  • MaximumLengthErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Größe der längsten Zeichenfolge in der Spalte.

  • AverageLengthErforderlich: Zahl (Double), nicht mehr als Keine.

    Die durchschnittliche Länge der Zeichenfolge in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

  • NumberOfDistinctValuesErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der unterschiedlichen Werte in einer Spalte.

BinaryColumnStatisticsData Struktur

Definiert Spaltenstatistiken, die für Bitfolge-Datenwerte unterstützt werden.

Felder
  • MaximumLengthErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Größe der längsten Bitfolge in der Spalte.

  • AverageLengthErforderlich: Zahl (Double), nicht mehr als Keine.

    Die durchschnittliche Bitfolgelänge in der Spalte.

  • NumberOfNullsErforderlich: Zahl (lang), nicht mehr als Keine.

    Die Anzahl der Nullwerte in der Spalte.

Zeichenfolgemuster

The API verwendet die folgenden regulären Ausdrücke, um zu definieren, welcher Inhalt für verschiedene Zeichenkettenparameter und Elemente gültig ist:

  • Einzeiliges Zeichenfolgenmuster – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • URIAdresse: mehrzeiliges Zeichenkettenmuster — "“ [\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*

  • Ein Logstash-Grok-Zeichenfolgenmuster – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Bezeichner-Zeichenfolgemuster – "[A-Za-z_][A-Za-z0-9_]*"

  • AWSIAMARNZeichenkettenmuster — "“ arn:aws:iam::\d{12}:role/.*

  • Versionszeichenfolgemuster – "^[a-zA-Z0-9-_]+$"

  • Protokollgruppen-Zeichenfolgemuster – "[\.\-_/#A-Za-z0-9]+"

  • Protokollstream-Zeichenfolgemuster – "[^:*]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #10 – "[^\r\n]"

  • Benutzerdefiniertes Zeichenfolgenmuster #11 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$"

  • Benutzerdefiniertes Zeichenfolgenmuster #12 – "^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]"

  • Benutzerdefiniertes Zeichenfolgenmuster #13 – "\S+"

  • Benutzerdefiniertes Zeichenfolgenmuster #14 – "^(https?):\/\/[^\s/$.?#].[^\s]*$"

  • Benutzerdefiniertes Zeichenfolgenmuster #15 – "^subnet-[a-z0-9]+$"

  • Benutzerdefiniertes Zeichenfolgenmuster #16 – "[\p{L}\p{N}\p{P}]*"

  • Benutzerdefiniertes Zeichenfolgenmuster #17 – "[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}"

  • Benutzerdefiniertes Zeichenfolgenmuster #18 – "[a-zA-Z0-9-_$#.]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #19 – "^\w+\.\w+\.\w+$"

  • Benutzerdefiniertes Zeichenfolgenmuster #20 – "^\w+\.\w+$"

  • Benutzerdefiniertes Zeichenfolgenmuster #21 – "^([2-3]|3[.]9)$"

  • Benutzerdefiniertes Zeichenfolgenmuster #22 – "arn:(aws|aws-us-gov|aws-cn):glue:.*"

  • Benutzerdefiniertes Zeichenfolgenmuster #23 – "(^arn:aws:iam::\w{12}:root)"

  • Benutzerdefiniertes Zeichenfolgenmuster #24 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+"

  • Benutzerdefiniertes Zeichenfolgenmuster #25 – "arn:aws:kms:.*"

  • Benutzerdefiniertes Zeichenfolgenmuster #26 – "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • Benutzerdefiniertes Zeichenfolgenmuster #27 – "[\.\-_A-Za-z0-9]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #28 – "^s3://([^/]+)/([^/]+/)*([^/]+)$"

  • Benutzerdefiniertes Zeichenfolgenmuster #29 – ".*"

  • Benutzerdefiniertes Zeichenfolgenmuster #30 – "^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$"

  • Benutzerdefiniertes Zeichenfolgenmuster #31 – "[a-zA-Z0-9_.-]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #32 – "[A-Z][A-Za-z\.]+"

  • Benutzerdefiniertes Zeichenfolgenmuster #33 – ".*\S.*"

  • Benutzerdefiniertes Zeichenfolgenmuster #34 – „[a-zA-Z0-9-=._/@]+

  • Benutzerdefiniertes Zeichenfolgenmuster Nr. 35 – „[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*

  • Benutzerdefiniertes Zeichenkettenmuster #36 — "[\s\S]*

  • Benutzerdefiniertes Zeichenkettenmuster #37 — "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*

  • Benutzerdefiniertes Zeichenkettenmuster #38 — "^[A-Z\_]+$

  • Benutzerdefiniertes Zeichenkettenmuster #39 — "^[A-Za-z0-9]+$

  • Benutzerdefiniertes Zeichenkettenmuster #40 — "[*A-Za-z0-9_-]*

  • Benutzerdefiniertes Zeichenkettenmuster #41 — "([\u0020-\u007E\r\s\n])*

  • Benutzerdefiniertes Zeichenkettenmuster #42 — "[A-Za-z0-9_-]*

  • Benutzerdefiniertes Zeichenkettenmuster #43 — "([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*

  • Benutzerdefiniertes Zeichenkettenmuster #44 — "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*

  • Benutzerdefiniertes Zeichenkettenmuster #45 — "([^\r\n])*