Partitions-API - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Partitions-API

Die Partitions-API beschreibt Datentypen und Operationen für die Arbeit mit Partitionen.

Datentypen

Partitionsstruktur

Stellt ein Segment der Tabellendaten dar.

Felder
  • Values – Ein UTF-8-Zeichenfolgen-Array.

    Die Werte der Partition.

  • DatabaseName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Name der Katalogdatenbank, in der die Partition angelegt wird.

  • TableName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Datenbanktabelle, in der die Partition erstellt wird.

  • CreationTime – Zeitstempel.

    Die Uhrzeit, zu der die Partition erstellt wurde.

  • LastAccessTime – Zeitstempel.

    Die Uhrzeit, zu der das letzte Mal auf die Partition zugegriffen wurde.

  • StorageDescriptor – Ein StorageDescriptor-Objekt.

    Stellt Informationen über den physischen Standort bereit, an dem die Partition gespeichert ist.

  • Parameters – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.

    Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.

    Diese Schlüssel-Wert-Paare definieren Partitionsparameter.

  • LastAnalyzedTime – Zeitstempel.

    Der letzte Zeitpunkt, zu dem die Spaltenstatistiken für diese Partition berechnet wurden.

  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalogs, in dem die Partition gespeichert ist.

PartitionInput Struktur

Die Struktur, die zum Erstellen und Aktualisieren einer Partition verwendet wird.

Felder
  • Values – Ein UTF-8-Zeichenfolgen-Array.

    Die Werte der Partition. Obwohl dieser Parameter nicht von der SDK gefordert wird, müssen Sie diesen Parameter als einen gültigen Wert angeben.

    Die Werte für die Schlüssel für die neue Partition müssen als Array von Zeichenfolgenobjekten übergeben werden, die in derselben Reihenfolge wie die Partitionsschlüssel im Amazon S3-Präfix sortiert werden müssen. Andernfalls AWS Glue werden die Werte zu den falschen Schlüsseln hinzugefügt.

  • LastAccessTime – Zeitstempel.

    Die Uhrzeit, zu der das letzte Mal auf die Partition zugegriffen wurde.

  • StorageDescriptor – Ein StorageDescriptor-Objekt.

    Stellt Informationen über den physischen Standort bereit, an dem die Partition gespeichert ist.

  • Parameters – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.

    Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.

    Diese Schlüssel-Wert-Paare definieren Partitionsparameter.

  • LastAnalyzedTime – Zeitstempel.

    Der letzte Zeitpunkt, zu dem die Spaltenstatistiken für diese Partition berechnet wurden.

PartitionSpecWithSharedStorageDescriptor Struktur

Eine Partitionsspezifikation für Partitionen mit einem gemeinsamen physischen Standort.

Felder
  • StorageDescriptor – Ein StorageDescriptor-Objekt.

    Die freigegebenen physischen Speicherinformationen.

  • Partitions – Ein Array mit Partition-Objekten.

    Eine Liste der Partitionen, die diesen physischen Standort gemeinsam verwenden.

PartitionListComposingSpec Struktur

Listet die zugehörigen Partitionen auf.

Felder
  • Partitions – Ein Array mit Partition-Objekten.

    Eine Liste der Partitionen in der Erstellungsspezifikation.

PartitionSpecProxy Struktur

Bietet einen Stammpfad für angegebene Partitionen.

Felder
  • DatabaseName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Katalogdatenbank, in der die Partitionen gespeichert sind.

  • TableName – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Tabelle, die die Partitionen enthält.

  • RootPath – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Stammpfad des Proxys zur Adressierung der Partitionen.

  • PartitionSpecWithSharedSD – Ein PartitionSpecWithSharedStorageDescriptor-Objekt.

    Eine Spezifikation für Partitionen, die denselben physischen Standort verwenden.

  • PartitionListComposingSpec – Ein PartitionListComposingSpec-Objekt.

    Gibt eine Liste der Partitionen an.

PartitionValueList Struktur

Enthält eine Liste von Werten zur Definition von Partitionen.

Felder
  • ValuesErforderlich: Ein Array von UTF-8 Zeichenketten.

    Die Liste der Werte.

Segmentstruktur

Definiert eine nicht überlappende Region der Partitionen einer Tabelle, sodass mehrere Anforderungen parallel ausgeführt werden können.

Felder
  • SegmentNumberErforderlich: Zahl (Ganzzahl), nicht mehr als Keine.

    Die nullbasierte Indexnummer dieses Segments. Wenn beispielsweise die Gesamtzahl der Segmente 4 ist, liegen die SegmentNumber-Werte im Bereich von 0 bis 3.

  • TotalSegmentsErforderlich:Zahl (Ganzzahl), nicht weniger als 1 oder mehr als 10.

    Die Gesamtzahl der Segmente.

PartitionError Struktur

Enthält Informationen zu einem Partitionsfehler.

Felder
  • PartitionValues – Ein UTF-8-Zeichenfolgen-Array.

    Die Werte, die die Partition definieren.

  • ErrorDetail – Ein ErrorDetail-Objekt.

    Details zum Partitionsfehler.

BatchUpdatePartitionFailureEntry Struktur

Enthält Informationen zu einem Batch-Update-Partitionsfehler.

Felder
  • PartitionValueList – Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.

    Eine Liste der Werte zur Definition der Partitionen.

  • ErrorDetail – Ein ErrorDetail-Objekt.

    Details zum Batch-Update-Partitionsfehler.

BatchUpdatePartitionRequestEntry Struktur

Eine Struktur, welche die Werte und die Struktur enthält, die zum Aktualisieren einer Partition verwendet werden.

Felder
  • PartitionValueListErforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.

    Eine Liste der Werte zur Definition der Partitionen.

  • PartitionInputErforderlich: Ein PartitionInput-Objekt.

    Die Struktur, die zum Aktualisieren einer Partition verwendet wird.

StorageDescriptor Struktur

Beschreibt den physischen Speicher von Tabellendaten.

Felder
  • Columns – Ein Array mit Spalte-Objekten.

    Eine Liste der Columns in der Tabelle.

  • Location – Standort-Zeichenfolge, nicht mehr als 2056 Bytes lang, passend zum URI address multi-line string pattern.

    Der physische Speicherort der Tabelle. Standardmäßig ist dies der Lager-Speicherort, gefolgt vom Datenbank-Standort in der Lagerorganisation, gefolgt vom Namen der Tabelle.

  • AdditionalLocations – Ein UTF-8-Zeichenfolgen-Array.

    Eine Liste von Speicherorten, die auf den Pfad verweisen, in dem sich eine Delta-Tabelle befindet.

  • InputFormat – Format-Zeichenfolge, nicht mehr als 128 Bytes lang, passend zum Single-line string pattern.

    Eingabeformat SequenceFileInputFormat (binär), TextInputFormat oder ein benutzerdefiniertes Format.

  • OutputFormat – Format-Zeichenfolge, nicht mehr als 128 Bytes lang, passend zum Single-line string pattern.

    Ausgabeformat SequenceFileOutputFormat (binär), IgnoreKeyTextOutputFormat oder ein benutzerdefiniertes Format.

  • Compressed – Boolesch.

    True, wenn die Daten in der Tabelle komprimiert sind und False, wenn dies nicht der Fall ist.

  • NumberOfBuckets – Zahl (Ganzzahl).

    Muss angegeben werden, wenn die Tabelle Dimensionsspalten enthält.

  • SerdeInfo – Ein SerDeInformationen-Objekt.

    Die Informationen zur Serialisierung/Deserialisierung (). SerDe

  • BucketColumns – Ein UTF-8-Zeichenfolgen-Array.

    Eine Liste mit Reducer-Gruppierungsspalten, Cluster-Spalten und Bucketing-Spalten in der Tabelle.

  • SortColumns – Ein Array mit Order-Objekten.

    Eine Liste mit der Sortierreihenfolge der einzelnen Buckets in der Tabelle.

  • Parameters – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.

    Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.

    Vom Benutzer angegebene Eigenschaften im Schlüssel-Wert-Format.

  • SkewedInfo – Ein SkewedInfo-Objekt.

    Informationen über Werte, die sehr häufig in einer Spalte vorkommen (verzerrte Werte).

  • StoredAsSubDirectories – Boolesch.

    True, wenn die Tabellendaten in Unterverzeichnissen gespeichert werden, andernfalls False.

  • SchemaReference – Ein SchemaReference-Objekt.

    Ein Objekt, das auf ein in der Schemaregistry gespeichertes Schema verweist. AWS Glue

    Beim Erstellen einer Tabelle können Sie eine leere Liste von Spalten für das Schema übergeben und stattdessen eine Schemaverweisung verwenden.

SchemaReference Struktur

Ein Objekt, das auf ein in der Schemaregistry gespeichertes AWS Glue Schema verweist.

Felder
  • SchemaId – Ein SchemaId-Objekt.

    Eine Struktur, die Schema-Identitätsfelder enthält. Entweder dies oder SchemaVersionId muss zur Verfügung gestellt werden.

  • SchemaVersionId – UTF-8-Zeichenfolge, nicht weniger als 36 oder mehr als 36 Bytes lang, passend zum Custom string pattern #17.

    Die eindeutige ID, die einer Version des Schemas zugewiesen ist. Entweder dies oder SchemaId muss zur Verfügung gestellt werden.

  • SchemaVersionNumber – Zahl (lang), nicht kleiner als 1 oder größer als 100 000.

    Die Versionsnummer des Schemas.

SerDeInfo Struktur

Informationen über ein Serialisierungs-/Deserialisierungsprogramm (SerDe), das als Extraktor und Loader dient.

Felder
  • Name – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    SerDeName des.

  • SerializationLibrary – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Normalerweise die Klasse, die das implementiert SerDe. Ein Beispiel ist org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe.

  • Parameters – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine Schlüsselzeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang und entspricht dem Single-line string pattern.

    Jeder Wert ist eine UTF-8-Zeichenfolge, nicht mehr als 512 000 Bytes lang.

    Diese Schlüssel-Wert-Paare definieren Initialisierungsparameter für. SerDe

SkewedInfo Struktur

Gibt verzerrte Werte in einer Tabelle an. Verzerrte Werte sind solche, die mit sehr hoher Häufigkeit auftreten.

Felder
  • SkewedColumnNames – Ein UTF-8-Zeichenfolgen-Array.

    Eine Liste der Namen von Spalten, die verzerrte Werte enthalten.

  • SkewedColumnValues – Ein UTF-8-Zeichenfolgen-Array.

    Eine Liste der Werte, die so häufig auftreten, dass sie als verzerrt betrachtet werden.

  • SkewedColumnValueLocationMaps – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge.

    Jeder Wert ist eine UTF-8-Zeichenfolge.

    Ein Mapping verzerrter Werte zu den Spalten, die sie enthalten.

Operationen

CreatePartition Aktion (Python: create_partition)

Erstellt eine neue Partition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die AWS Konto-ID des Katalogs, in dem die Partition erstellt werden soll.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatendatenbank, in der die Partition erstellt werden soll.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatendatentabelle, in der die Partition erstellt werden soll.

  • PartitionInputErforderlich: Ein PartitionInput-Objekt.

    Eine PartitionInput-Struktur, die die zu erstellende Partition definiert.

Antwort
  • Keine Antwortparameter.

Fehler
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • EntityNotFoundException

  • OperationTimeoutException

  • GlueEncryptionException

BatchCreatePartition Aktion (Python: batch_create_partition)

Erstellt eine oder mehrere Partitionen in einem Batchvorgang.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Katalogs, in dem die Partition erstellt wird. Derzeit sollte dies die Konto-ID sein. AWS

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatendatenbank, in der die Partition erstellt werden soll.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatendatentabelle, in der die Partition erstellt werden soll.

  • PartitionInputListErforderlich: Ein Array mit PartitionInput-Objekten, nicht mehr als 100 Strukturen.

    Eine Liste der PartitionInput-Strukturen, die die zu erstellenden Partitionen definieren.

Antwort
  • Errors – Ein Array mit PartitionError-Objekten.

    Die beim Erstellen der angeforderten Partitionen aufgetretenen Fehler.

Fehler
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • EntityNotFoundException

  • OperationTimeoutException

  • GlueEncryptionException

UpdatePartition Aktion (Python: update_partition)

Aktualisiert eine Partition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die zu aktualisierende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Tabelle, in der sich die zu aktualisierende Partition befindet.

  • PartitionValueListErforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.

    Liste von Partitionsschlüsselwerten, welche die Partition definieren.

  • PartitionInputErforderlich: Ein PartitionInput-Objekt.

    Das neue Partitionsobjekt zur Aktualisierung der Partition.

    Die Values-Eigenschaft kann nicht geändert werden. Wenn Sie die Partitionsschlüsselwerte für eine Partition ändern möchten, löschen Sie die Partition und erstellen Sie sie neu.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

DeletePartition Aktion (Python: delete_partition)

Löscht eine angegebene Partition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die zu löschende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Tabelle, die die Partition enthält, die gelöscht werden soll.

  • PartitionValuesErforderlich: Ein Array von UTF-8-Zeichenketten.

    Die Werte, die die Partition definieren.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

BatchDeletePartition Aktion (Python: batch_delete_partition)

Löscht eine oder mehrere Partitionen in einem Batchvorgang.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die zu löschende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die entsprechende Tabelle befindet.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Tabelle, die die Partitionen enthält, die gelöscht werden sollen.

  • PartitionsToDeleteErforderlich: Ein Array mit PartitionValueListe-Objekten, nicht mehr als 25 Strukturen.

    Eine Liste der PartitionInput-Strukturen, die die zu löschenden Partitionen definieren.

Antwort
  • Errors – Ein Array mit PartitionError-Objekten.

    Die beim Löschen der angeforderten Partitionen aufgetretenen Fehler.

Fehler
  • InvalidInputException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

GetPartition Aktion (Python: get_partition)

Ruft Informationen zu einer bestimmten Partition ab.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechende Partition befindet. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partition befindet.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionstabelle.

  • PartitionValuesErforderlich: Ein Array von UTF-8-Zeichenketten.

    Die Werte, die die Partition definieren.

Antwort
  • Partition – Ein Partition-Objekt.

    Die angeforderten Informationen in Form eines Partition-Objekts.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • FederationSourceException

  • FederationSourceRetryableException

GetPartitions Aktion (Python: get_partitions)

Ruft Informationen über die Partitionen in einer Tabelle ab.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partitionen befinden.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionentabelle.

  • Expression – Prädikatszeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Ein Ausdruck, der die Partitionen filtert, die zurückgegeben werden sollen.

    Der Ausdruck verwendet SQL-Syntax ähnlich wie die SQL-Filterklausel WHERE. Die SQL-Anweisungsparser JSQLParser analysiert den Ausdruck.

    Operatoren: Im Folgenden finden Sie die Operatoren, die Sie im Expression API-Aufruf verwenden können:

    =

    Prüft, ob die Werte der beiden Operanden gleich sind. Wenn ja, wird die Bedingung wahr.

    Beispiel: Angenommen, 'variable a' hat den Wert 10, und 'variable b' hat den Wert 20.

    (a = b) ist nicht wahr.

    < >

    Prüft, ob die Werte der beiden Operanden gleich sind. Sind die Werte nicht gleich, wird die Bedingung wahr.

    Beispiel: (a < > b) ist wahr.

    >

    Prüft, ob der Wert des linken Operanden größer als der Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.

    Beispiel: (a > b) ist nicht wahr.

    <

    Prüft, ob der Wert des linken Operanden kleiner als der Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.

    Beispiel: (a < b) ist wahr.

    >=

    Prüft, ob der Wert des linken Operanden größer oder gleich dem Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.

    Beispiel: (a >= b) ist nicht wahr.

    <=

    Prüft, ob der Wert des linken Operanden kleiner oder gleich dem Wert des rechten Operanden ist. Wenn ja, wird die Bedingung wahr.

    Beispiel: (a <= b) ist wahr.

    AND, OR, IN, BETWEEN, LIKE, NOT, IS NULL

    Logische Operatoren.

    Unterstützte Partitionsschlüsseltypen: Im Folgenden finden Sie die unterstützten Partitionsschlüssel.

    • string

    • date

    • timestamp

    • int

    • bigint

    • long

    • tinyint

    • smallint

    • decimal

    Wird ein Typ erkannt, der nicht gültig ist, wird eine Ausnahme ausgegeben.

    Die folgende Liste zeigt die gültigen Operatoren für jeden Typ. Wenn Sie einen Crawler definieren, wird der partitionKey-Typ als STRINGerstellt, damit er mit den Katalogpartitionen kompatibel ist.

    API-Beispielaufruf:

    Die Tabelle twitter_partition hat drei Partitionen:

    year = 2015 year = 2016 year = 2017

    Partition year gleich 2015 abrufeb

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year*=*'2015'"

    Partition year zwischen 2016 und 2018 (ausschließlich) abrufen

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>'2016' AND year<'2018'"

    Partition year zwischen 2015 und 2018 (einschließlich) abrufen. Die folgenden API-Aufrufe sind miteinander äquivalent:

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year>='2015' AND year<='2018'" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year BETWEEN 2015 AND 2018" aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year IN (2015,2016,2017,2018)"

    Ein Platzhalter-Partitionsfilter, wobei die Ausgabe des folgendes Aufrufs Partition Jahr = 2017 ist. Ein regulärer Ausdruck wird in LIKE nicht unterstützt.

    aws glue get-partitions --database-name dbname --table-name twitter_partition --expression "year LIKE '%7'"
  • NextToken – UTF-8-Zeichenfolge.

    Ein Fortsetzungs-Token, wenn dies nicht der erste Aufruf zum Abrufen dieser Partitionen ist.

  • Segment – Ein Segment-Objekt.

    Das Segment der Tabellenpartitionen, das in dieser Anforderung gescannt werden soll.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Gibt die maximale Anzahl der Partitionen an, die in einer Antwort zurückzugeben sind.

  • ExcludeColumnSchema – Boolesch.

    Wenn der Wert „true“ ist, wird das Partitionsspaltenschema nicht zurückgegeben. Nützlich, wenn Sie nur an anderen Partitionsattributen wie Partitionswerten oder Speicherort interessiert sind. Bei diesem Ansatz wird eine große Antwort vermieden, da keine doppelten Daten zurückgegeben werden.

  • TransactionId – UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Custom string pattern #16.

    Die Transaktions-ID, an der der Partitionsinhalt gelesen werden soll.

  • QueryAsOfTime – Zeitstempel.

    Die Zeit, zu der der Partitionsinhalt gelesen werden muss. Wenn nicht festgelegt, wird die letzte Transaktions-Commit-Zeit verwendet. Kann nicht zusammen mit TransactionId angegeben werden.

Antwort
  • Partitions – Ein Array mit Partition-Objekten.

    Eine Liste von angeforderten Partitionen.

  • NextToken – UTF-8-Zeichenfolge.

    Ein Fortsetzungs-Token, falls die zurückgegebene Liste der Partitionen die letzte nicht enthält.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

  • InvalidStateException

  • ResourceNotReadyException

  • FederationSourceException

  • FederationSourceRetryableException

BatchGetPartition Aktion (Python: batch_get_partition)

Ruft Partitionen in einer Batchanforderung ab.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die AWS Konto-ID verwendet.

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partitionen befinden.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionentabelle.

  • PartitionsToGetErforderlich: Ein Array mit PartitionValueListe-Objekten, nicht mehr als 1000 Strukturen.

    Eine Liste der Partitionswerte, die die abzurufenden Partitionen identifizieren.

Antwort
  • Partitions – Ein Array mit Partition-Objekten.

    Eine Liste der angeforderten Partitionen.

  • UnprocessedKeys – Ein Array mit PartitionValueListe-Objekten, nicht mehr als 1000 Strukturen.

    Eine Liste der Partitionswerte in der Anforderung, für die keine Partitionen zurückgegeben wurden.

Fehler
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

  • InvalidStateException

  • FederationSourceException

  • FederationSourceRetryableException

BatchUpdatePartition Aktion (Python: batch_update_partition)

Aktualisiert eine oder mehrere Partitionen in einem Batchvorgang.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Katalogs, in dem die Partition aktualisiert wird. Derzeit sollte dies die Konto-ID sein. AWS

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatendatenbank, in der die Partition aktualisiert werden soll.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Metadatentabelle, in der die Partition aktualisiert werden soll.

  • EntriesErforderlich: Ein Array mit BatchUpdatePartitionRequestEintrag-Objekten, nicht weniger als 1 und nicht mehr als 100 Strukturen.

    Eine Liste von bis zu 100 BatchUpdatePartitionRequestEntry-Objekte, die aktualisiert werden sollen.

Antwort
  • Errors – Ein Array mit BatchUpdatePartitionFailureEintrag-Objekten.

    Die beim Aktualisieren der angeforderten Partitionen aufgetretenen Fehler. Eine Liste von BatchUpdatePartitionFailureEntry-Objekten.

Fehler
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

GetColumnStatisticsForPartition Aktion (Python: get_column_statistics_for_partition)

Ruft Partitionsstatistiken von Spalten ab.

Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet GetPartition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partitionen befinden.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionentabelle.

  • PartitionValuesErforderlich: Ein Array von UTF-8-Zeichenketten.

    Eine Liste der Partitionswerte, welche die Partition identifizieren.

  • ColumnNamesErforderlich: Ein Array mit UTF-8-Zeichenfolgen, nicht mehr als 100 Zeichenfolgen.

    Eine Liste der Spaltennamen.

Antwort
  • ColumnStatisticsList – Ein Array mit ColumnStatistics-Objekten.

    Die Liste ColumnStatistics davon konnte nicht abgerufen werden.

  • Errors – Ein Array mit ColumnError-Objekten.

    Beim Abrufen von Spaltenstatistikdaten ist ein Fehler aufgetreten.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

UpdateColumnStatisticsForPartition Aktion (Python: update_column_statistics_for_partition)

Erstellt oder aktualisiert die Partitionsstatistiken von Spalten.

Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet UpdatePartition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partitionen befinden.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionentabelle.

  • PartitionValuesErforderlich: Ein Array von UTF-8-Zeichenketten.

    Eine Liste der Partitionswerte, welche die Partition identifizieren.

  • ColumnStatisticsListErforderlich: Ein Array mit ColumnStatistics-Objekten, nicht mehr als 25 Strukturen.

    Eine Liste der Spaltenstatistiken.

Antwort
  • Errors – Ein Array mit ColumnStatisticsError-Objekten.

    Beim Aktualisieren von Spaltenstatistikdaten ist ein Fehler aufgetreten.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

DeleteColumnStatisticsForPartition Aktion (Python: delete_column_statistics_for_partition)

Löscht die Partitionsspaltenstatistiken einer Spalte.

Die für diesen Vorgang erforderliche Identity and Access Management (IAM)-Berechtigung lautet DeletePartition.

Anforderung
  • CatalogId – Katalog-ID-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die ID des Data Catalog, in dem sich die entsprechenden Partitionen befinden. Wenn keine angegeben wird, wird standardmäßig die Konto-ID verwendet. AWS

  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Katalogdatenbank, in der sich die Partitionen befinden.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der Partitionentabelle.

  • PartitionValuesErforderlich: Ein Array von UTF-8-Zeichenketten.

    Eine Liste der Partitionswerte, welche die Partition identifizieren.

  • ColumnNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Name der Spalte.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException