Carga de datos desde Amazon S3 - Amazon Redshift

Carga de datos desde Amazon S3

El comando COPY utiliza la arquitectura de procesamiento masivo en paralelo (MPP) de Amazon Redshift para leer y cargar datos en paralelo desde uno o varios archivos de un bucket de Amazon S3. Puede aprovechar al máximo los beneficios del procesamiento en paralelo mediante la división de los datos en distintos archivos, en los casos en que los archivos estén comprimidos. (Hay excepciones a esta regla. Se detallan en Divida los datos de carga). También puede aprovechar al máximo los beneficios del procesamiento en paralelo mediante la configuración de claves de distribución en las tablas. Para obtener más información acerca de las claves de distribución, consulte Uso de estilos de distribución de datos.

Los datos se cargan en la tabla destino, una línea por fila. Los campos en el archivo de datos se corresponden con las columnas de la tabla, de izquierda a derecha. Los campos en los archivos de datos pueden ser de ancho fijo o con caracteres delimitados; el delimitador predeterminado es la barra vertical (|). De manera predeterminada, se cargan todas las columnas de la tabla, pero de manera alternativa se puede definir una lista de columnas separadas por comas. Si una columna de la tabla no se encuentra en la lista de columnas especificada en el comando COPY, se carga con un valor predeterminado. Para obtener más información, consulte Carga de valores de columna predeterminados.