Conversión a formatos de columnas
El rendimiento de las consultas de Amazon Athena mejora si convierte los datos a formatos de columnas de código abierto, como Apache Parquet
Las opciones para convertir fácilmente los datos de origen, como JSON o CSV, a un formato de columnas incluyen el uso de consultas CREATE TABLE AS o ejecución de trabajos en AWS Glue.
-
Puede usar consultas
CREATE TABLE AS
(CTAS) para convertir datos a Parquet u ORC en un solo paso. Para ver un ejemplo, consulte Ejemplo: escritura de los resultados de la consulta en un formato diferente en la página Ejemplos de consultas CTAS. -
Para obtener información sobre cómo ejecutar un trabajo de AWS Glue para transformar datos en CSV a Parquet, consulte la sección “Transform the data from CSV to Parquet format” (Transformar datos en formato CSV a Parquet) en la publicación de blog de macrodatos de AWS Build a Data Lake Foundation with AWS Glue and Amazon S3
(Crear una base de lago de datos con AWS Glue y Amazon S3). AWS Glue admite el uso de la misma técnica para convertir datos en CSV a ORC, o datos en JSON a Parquet u ORC.