Bibliotecas de SerDe JSON
En Athena, puede utilizar dos bibliotecas SerDe para deserializar datos JSON. La deserialización convierte los datos JSON para que se puedan serializar (escribir) en un formato diferente como Parquet u ORC.
-
El SerDe JSON de Hive nativo
-
Con la El SerDe JSON de OpenX
-
Con la SerDe de Amazon Ion Hive
nota
Las bibliotecas de Hive y OpenX esperan que los datos JSON estén en una sola línea (sin formato), con registros separados por un carácter de nueva línea. Sin embargo, Amazon Ion Hive SerDe no tiene ese requisito y puede utilizarse como alternativa, ya que el formato de datos Ion es un superconjunto de JSON.
Nombres de las bibliotecas
Utilice una de las siguientes:
org.apache.hive.hcatalog.data.JsonSerDe
org.openx.data.jsonserde.JsonSerDe
com.amazon.ionhiveserde.IonHiveSerDe
Recursos adicionales de
Para obtener más información sobre cómo trabajar con JSON y JSON anidado en Athena, consulte los siguientes recursos:
-
Create tables in Amazon Athena from nested JSON and mappings using JSONSerDe
(Crear tablas en Amazon Athena a partir de JSON anidado y asignaciones por medio de JSONSerDe) (Blog de macrodatos en AWS) -
Recibo errores cuando intento leer datos JSON en Amazon Athena
(artículo del centro de conocimiento de AWS) -
hive-json-schema
(GitHub): herramienta escrita en Java que genera instrucciones CREATE TABLE
de documentos JSON de ejemplo. Las instruccionesCREATE TABLE
que se generan utilizan SerDe JSON de OpenX.