Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
SerDe bibliothèques JSON
Dans Athena, vous pouvez utiliser des SerDe bibliothèques pour désérialiser les données JSON. La désérialisation convertit les données JSON afin qu'elles puissent être sérialisées (écrites) dans un format différent comme Parquet ou ORC.
-
La bibliothèque Hive JSON SerDe native
-
L'interface OpenX JSON SerDe
-
L'interface SerDe Amazon Ion Hive
Note
Les bibliothèques Hive et OpenX s'attendent à ce que les données JSON soient sur une seule ligne (non formatées), les registres étant séparés par un caractère de nouvelle ligne. L'Amazon Ion Hive SerDe ne répond pas à cette exigence et peut être utilisé comme alternative car le format de données Ion est un sur-ensemble de JSON.
Noms des bibliothèques
Utilisez l'une des options suivantes :
org.apache.hive.hcatalog.data. JsonSerDe
org.openx.data.json. JsonSerDe
com.amazon.ionhiveserde. IonHiveSerDe
Ressources supplémentaires
Pour de plus amples informations sur l'utilisation de JSON et de JSON imbriqué dans Athena, consultez les ressources suivantes :
-
Création de tables dans Amazon Athena à partir de JSON imbriqué et de mappages à l'aide de JSON SerDe
(AWS Big Data Blog) -
Je reçois des erreurs lorsque j'essaie de lire des données JSON dans Amazon Athena
(article du AWS Knowledge Center) -
hive-json-schema
(GitHub) — Outil écrit en Java qui génère des CREATE TABLE
instructions à partir d'exemples de documents JSON. Les instructionsCREATE TABLE
générées utilisent le SerDe JSON OpenX.