Types de données courants - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Types de données courants

Les types de données courants décrivent des types de données courants variés dans AWS Glue.

Structure de balise

L'Tagobjet représente une étiquette que vous pouvez attribuer à une AWS ressource. Chaque balise est constituée d’une clé et d’une valeur facultative que vous définissez.

Pour plus d'informations sur les balises et le contrôle de l'accès aux ressources dans AWS Glue, voir AWS Tags in AWS Glue et Spécification AWS Glue des ARN des ressources dans le guide du développeur.

Champs
  • key – Chaîne UTF-8, d'une longueur comprise entre 1 et 128 octets.

    Identification de balise. La clé est obligatoire lorsque vous créez une balise sur un objet. La clé est sensible à la casse et ne doit pas contenir le préfixe aws.

  • value – Chaîne UTF-8, d'une longueur maximale de 256 octets.

    Valeur de balise. La valeur est facultative lorsque vous créez une balise sur un objet. La valeur est sensible à la casse et ne doit pas contenir le préfixe aws.

DecimalNumber structure

Contient une valeur numérique au format décimal.

Champs
  • UnscaledValueobligatoire : blob.

    Valeur numérique non mise à l'échelle.

  • Scaleobligatoire : nombre (entier).

    Échelle qui détermine où la virgule décimale tombe dans la valeur non mise à l'échelle.

ErrorDetail structure

Contient des informations détaillées sur une erreur.

Champs
  • ErrorCode – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Code associé à cette erreur.

  • ErrorMessage – Chaîne de description, d'une longueur maximale de 2 048 octets, correspondant au URI address multi-line string pattern.

    Message décrivant l'erreur.

PropertyPredicate structure

Définit un prédicat de propriété.

Champs
  • Key – chaîne de valeur, d'une longueur maximale de 1 024 octets.

    Clé de la propriété.

  • Value – chaîne de valeur, d'une longueur maximale de 1 024 octets.

    Valeur de la propriété.

  • Comparator – Chaîne UTF-8 (valeurs valides : EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    Comparateur utilisé pour comparer cette propriété à d'autres.

ResourceUri structure

URI pour des ressources de fonction.

Champs
  • ResourceType – Chaîne UTF-8 (valeurs valides : JAR | FILE | ARCHIVE).

    Type de la ressource.

  • Uri – Identificateur de ressource uniforme (URI), d'une longueur comprise entre 1 et 1024 octets, correspondant au URI address multi-line string pattern.

    URI pour accéder à la ressource.

ColumnStatistics structure

Représente les statistiques au niveau de la colonne générées pour une table ou une partition.

Champs
  • ColumnNameObligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de la colonne à laquelle appartiennent les statistiques.

  • ColumnTypeobligatoire : saisissez le nom, d'une longueur maximale de 20 000 octets, correspondant à Single-line string pattern.

    Type de données de la colonne.

  • AnalyzedTimeobligatoire : horodatage.

    Horodatage du moment où les statistiques de colonne ont été générées.

  • StatisticsDataObligatoire : un objet ColumnStatisticsData.

    ColumnStatisticData qui contient les valeurs de données statistiques.

ColumnStatisticsError structure

Encapsule un objet ColumnStatistics qui a échoué et la raison de l'échec.

Champs
  • ColumnStatistics – Un objet ColumnStatistics.

    ColumnStatistics de la colonne.

  • Error – Un objet ErrorDetail.

    Message d'erreur avec la raison de l'échec d'une opération.

ColumnError structure

Encapsule un nom de colonne qui a échoué et la raison de l'échec.

Champs
  • ColumnName – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de la colonne ayant échoué.

  • Error – Un objet ErrorDetail.

    Message d'erreur avec la raison de l'échec d'une opération.

ColumnStatisticsData structure

Contient chacun des types de données statistiques de colonne. Un seul objet de données doit être défini et indiqué par l'attribut Type.

Champs
  • Typeobligatoire : chaîne UTF-8 (valeurs valides : BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    Type de données statistiques de colonne.

  • BooleanColumnStatisticsData – Un objet BooleanColumnStatisticsData.

    Données statistiques de colonne booléennes.

  • DateColumnStatisticsData – Un objet DateColumnStatisticsData.

    Données statistiques de colonne de date.

  • DecimalColumnStatisticsData – Un objet DecimalColumnStatisticsData.

    Données statistiques sur les colonnes décimales. UnscaledValues à l'intérieur se trouvent des objets binaires codés en Base64 stockant des représentations complémentaires à deux de la valeur décimale non mise à l'échelle.

  • DoubleColumnStatisticsData – Un objet DoubleColumnStatisticsData.

    Données statistiques à double colonne.

  • LongColumnStatisticsData – Un objet LongColumnStatisticsData.

    Données statistiques de colonne longue.

  • StringColumnStatisticsData – Un objet StringColumnStatisticsData.

    Données statistiques de colonne de chaîne.

  • BinaryColumnStatisticsData – Un objet BinaryColumnStatisticsData.

    Données de statistiques de colonne binaire.

BooleanColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les colonnes de données booléennes.

Champs
  • NumberOfTruesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs true dans la colonne.

  • NumberOfFalsesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs false dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

DateColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les colonnes de données d'horodatage.

Champs
  • MinimumValue – Horodatage.

    Valeur la plus faible dans la colonne.

  • MaximumValue – Horodatage.

    Valeur la plus élevée dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

  • NumberOfDistinctValuesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs distinctes dans une colonne.

DecimalColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les colonnes de données à virgule fixe.

Champs
  • MinimumValue – Un objet DecimalNumber.

    Valeur la plus faible dans la colonne.

  • MaximumValue – Un objet DecimalNumber.

    Valeur la plus élevée dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

  • NumberOfDistinctValuesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs distinctes dans une colonne.

DoubleColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les colonnes de données à virgule flottante.

Champs
  • MinimumValue – Nombre (double).

    Valeur la plus faible dans la colonne.

  • MaximumValue – Nombre (double).

    Valeur la plus élevée dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

  • NumberOfDistinctValuesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs distinctes dans une colonne.

LongColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les colonnes de données entières.

Champs
  • MinimumValue – Nombre (long).

    Valeur la plus faible dans la colonne.

  • MaximumValue – Nombre (long).

    Valeur la plus élevée dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

  • NumberOfDistinctValuesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs distinctes dans une colonne.

StringColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les valeurs de données de séquence de caractères.

Champs
  • MaximumLengthobligatoire : nombre (entier), pas plus que None (Aucun).

    Taille de la chaîne la plus longue dans la colonne.

  • AverageLengthobligatoire : nombre (double), pas plus que None (Aucun).

    Longueur moyenne de la chaîne dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

  • NumberOfDistinctValuesobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs distinctes dans une colonne.

BinaryColumnStatisticsData structure

Définit les statistiques de colonne prises en charge pour les valeurs de données de séquence de bits.

Champs
  • MaximumLengthobligatoire : nombre (entier), pas plus que None (Aucun).

    Taille de la séquence de bits la plus longue de la colonne.

  • AverageLengthobligatoire : nombre (double), pas plus que None (Aucun).

    Longueur moyenne de la séquence de bits dans la colonne.

  • NumberOfNullsobligatoire : nombre (entier), pas plus que None (Aucun).

    Nombre de valeurs null dans la colonne.

Modèles de chaîne

L'API utilise les expressions régulières suivantes pour définir le contenu valide pour différents paramètres et membres de chaîne :

  • Modèle de chaîne à ligne unique – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • Modèle de chaîne à plusieurs lignes d'adresse URI – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Modèle de chaîne Logstash Grok – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • Modèle de chaîne d'identifiant – "[A-Za-z_][A-Za-z0-9_]*"

  • Modèle de chaîne ARN AWS IAM – "arn:aws:iam::\d{12}:role/.*"

  • Modèle de chaîne de version – "^[a-zA-Z0-9-_]+$"

  • Modèle de chaîne de groupe de journaux – "[\.\-_/#A-Za-z0-9]+"

  • Modèle de chaîne de flux de journaux – "[^:*]*"

  • Modèle de chaîne personnalisée #10 – "[^\r\n]"

  • Modèle de chaîne personnalisée #11 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$"

  • Modèle de chaîne personnalisée #12 – "^(https?)://[-a-zA-Z0-9+@#/%?=~_|!:,.;]*[-a-zA-Z0-9+@#/%=~_|]"

  • Modèle de chaîne personnalisée #13 – "\S+"

  • Modèle de chaîne personnalisée #14 – "^(https?):\/\/[^\s/$.?#].[^\s]*$"

  • Modèle de chaîne personnalisée #15 – "^subnet-[a-z0-9]+$"

  • Modèle de chaîne personnalisée #16 – "[\p{L}\p{N}\p{P}]*"

  • Modèle de chaîne personnalisée #17 – "[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}"

  • Modèle de chaîne personnalisée #18 – "[a-zA-Z0-9-_$#.]+"

  • Modèle de chaîne personnalisée #19 – "^\w+\.\w+\.\w+$"

  • Modèle de chaîne personnalisée #20 – "^\w+\.\w+$"

  • Modèle de chaîne personnalisée #21 – "^([2-3]|3[.]9)$"

  • Modèle de chaîne personnalisée #22 – "arn:(aws|aws-us-gov|aws-cn):glue:.*"

  • Modèle de chaîne personnalisée #23 – "(^arn:aws:iam::\w{12}:root)"

  • Modèle de chaîne personnalisée #24 – « ^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+ »

  • Modèle de chaîne personnalisée #25 – « arn:aws:kms:.* »

  • Modèle de chaîne personnalisée #26 – « arn:aws[^:]*:iam::[0-9]*:role/.+ »

  • Modèle de chaîne personnalisée #27 – « [\.\-_A-Za-z0-9]+ »

  • Modèle de chaîne personnalisée #28 – « ^s3://([^/]+)/([^/]+/)*([^/]+)$ »

  • Modèle de chaîne personnalisée #29 – « .* »

  • Modèle de chaîne personnalisée #30 – « ^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$ »

  • Modèle de chaîne personnalisée #31 – « [a-zA-Z0-9_.-]+ »

  • Modèle de chaîne personnalisée #32 – « .*\S.* »

  • Modèle de chaîne personnalisée #33 – « [a-zA-Z0-9-=._/@]+ »

  • Modèle de chaîne personnalisée #34 – « [1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]* »

  • Modèle de chaîne personnalisée n° 35 – « [\s\S]* »

  • Schéma de chaîne personnalisé #36 — « ([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])* »

  • Schéma de chaîne personnalisé #37 — « [*A-Za-z0-9_-]* »

  • Schéma de chaîne personnalisé #38 — « ([\u0020-\u007E\r\s\n])* »

  • Schéma de chaîne personnalisé #39 — « [A-Za-z0-9_-]* »

  • Schéma de chaîne personnalisé #40 — « ([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'])* »

  • Schéma de chaîne personnalisé #41 — « ([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n])* »

  • Schéma de chaîne personnalisé #42 — « ([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])* »

  • Schéma de chaîne personnalisé #43 — « ([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\r\n])* »