Types de données dans Amazon Athena - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Types de données dans Amazon Athena

Lorsque vous exécutezCREATE TABLE, vous spécifiez les noms des colonnes et le type de données que chaque colonne peut contenir. Les tables que vous créez sont stockées dans AWS Glue Data Catalog.

Pour faciliter l'interopérabilité avec les autres moteurs de requêtes, Athena utilise les noms des types de données Apache Hive pour DDL des instructions telles que. CREATE TABLE Pour des DML requêtes telles queSELECT,CTAS, etINSERT INTO, Athena utilise les noms des types de données Trino. Le tableau suivant indique les types de données pris en charge dans Athena. Lorsque DDL et les DML types diffèrent en termes de nom, de disponibilité ou de syntaxe, ils sont indiqués dans des colonnes séparées.

DDL DML Description
BOOLEAN Les valeurs sont true et false.
TINYINT Un entier signé de 8 bits au format de complément à deux, avec une valeur minimale de -2 7 et une valeur maximale de 2 7 -1.
SMALLINT Un entier signé de 16 bits au format de complément à deux, avec une valeur minimale de -2 15 et une valeur maximale de 2 15 -1.
INT, INTEGER Une valeur signée de 32 bits au format de complément à deux, avec une valeur minimale de -2 31 et une valeur maximale de 2 31 -1.
BIGINT Un entier signé de 64 bits au format de complément à deux, avec une valeur minimale de -2 63 et une valeur maximale de 2 63 -1.
FLOAT REAL Nombre à virgule flottante à précision unique signé sur 32 bits. La plage est comprise entre 1,40129846432481707e-45 et 3,40282346638528860e+38, positif ou négatif. Suit la IEEE norme pour l'arithmétique à virgule flottante (754). IEEE
DOUBLE Nombre à virgule flottante à double précision signé sur 64 bits. La plage va de 4,94065645841246544e-324d à 1,79769313486231570e+308d, positif ou négatif. Suit la IEEE norme pour l'arithmétique à virgule flottante (754). IEEE
DECIMAL(precision, scale) precisionest le nombre total de chiffres. scale(facultatif) est le nombre de chiffres dans la partie fractionnaire avec une valeur par défaut de 0. Par exemple, utilisez ces définitions de type : decimal(11,5), decimal(15). La valeur maximale pour precision est 38, et la valeur maximale pour scale est de 38 ans.
CHAR, CHAR(length)

Données de caractères de longueur fixe, avec une longueur spécifiée comprise entre 1 et 255, telles que char (10). If length est spécifié, les chaînes sont tronquées à la longueur spécifiée lors de la lecture. Si la chaîne de données sous-jacente est plus longue, elle reste inchangée.

Pour plus d'informations, consultez la section Type de données CHAR Hive.

STRING VARCHAR Données de caractères de longueur variable.
VARCHAR(length) Données de caractères de longueur variable avec une longueur de lecture maximale. Les chaînes sont tronquées à la longueur spécifiée lors de la lecture. Si la chaîne de données sous-jacente est plus longue, elle reste inchangée.
BINARY VARBINARY Données binaires de longueur variable.
TIME Un moment de la journée précis à la milliseconde.
Non disponible TIME(precision) Un moment de la journée avec une précision précise. TIME(3)est équivalent àTIME.
Non disponible TIME WITH TIME ZONE Heure de la journée dans un fuseau horaire. Les fuseaux horaires doivent être spécifiés sous forme de décalages par rapport àUTC.
DATE Une date calendaire avec l'année, le mois et le jour.
TIMESTAMP TIMESTAMP, TIMESTAMP WITHOUT TIME ZONE Une date et une heure calendaires avec une précision de la milliseconde.
Non disponible TIMESTAMP(precision), TIMESTAMP(precision) WITHOUT TIME ZONE Une date et une heure calendaires avec une précision précise. TIMESTAMP(3)est équivalent àTIMESTAMP.
Non disponible TIMESTAMP WITH TIME ZONE Date et heure calendaires dans un fuseau horaire. Les fuseaux horaires peuvent être spécifiés sous forme de décalages par UTC rapport à, sous forme de noms de IANA fuseaux horairesUTC, ou en utilisant UT, Z ouGMT.
Non disponible TIMESTAMP(precision) WITH TIME ZONE Une date et une heure calendaires avec une précision précise, dans un fuseau horaire.
Non disponible INTERVALYEARÀ MONTH Un intervalle d'un ou de plusieurs mois entiers
Non disponible INTERVALDAYÀ SECOND Intervalle d'une ou plusieurs secondes, minutes, heures ou jours
ARRAY<element_type> ARRAY[element_type] Un tableau de valeurs. Toutes les valeurs doivent être du même type de données.
MAP<key_type, value_type> MAP(key_type, value_type) Une carte où les valeurs peuvent être recherchées par clé. Toutes les clés doivent être du même type de données et toutes les valeurs doivent être du même type de données. Par exemple, map<string, integer>.
STRUCT<field_name_1:field_type_1, field_name_2:field_type_2, …> ROW(field_name_1 field_type_1, field_name_2 field_type_2, …) Structure de données avec des champs nommés et leurs valeurs.
Non disponible JSON JSONtype de valeur, qui peut être un JSON objet, un JSON tableau, un JSON nombretrue, une JSON chaîne false ounull.
Non disponible UUID A UUID (Unique universellementIDentifier).
Non disponible IPADDRESS Une IPv4 ou une IPv6 adresse.
Non disponible HyperLogLog Ces types de données prennent en charge des fonctions internes approximatives. Pour plus d'informations sur chaque type, consultez le lien vers l'entrée correspondante dans la documentation de Trino.
P4 HyperLogLog
SetDigest
QDigest
TDigest