COPY de Amazon DynamoDB - Amazon Redshift

COPY de Amazon DynamoDB

Si desea cargar datos de una tabla existente de DynamoDB, utilice la cláusula FROM para especificar el nombre de la tabla de DynamoDB.

importante

Si la tabla de DynamoDB no se encuentra en la misma región que el clúster de Amazon Redshift, debe utilizar el parámetro REGION para especificar la región en la que se encuentran los datos.

Sintaxis

FROM 'dynamodb://table-name' authorization READRATIO ratio | REGION [AS] 'aws_region' | optional-parameters

Ejemplos

En el siguiente ejemplo, se cargan datos de una tabla de DynamoDB.

copy favoritemovies from 'dynamodb://ProductCatalog' iam_role 'arn:aws:iam::0123456789012:role/MyRedshiftRole' readratio 50;

Parámetros

FROM

El origen de los datos a cargar.

'dynamodb://table-name (nombre-tabla)'

Se trata del nombre de la tabla de DynamoDB que contiene los datos; por ejemplo, 'dynamodb://ProductCatalog'. Para obtener detalles acerca de cómo se asignan los atributos de DynamoDB a las columnas de Amazon Redshift, consulte Carga de datos desde una tabla de Amazon DynamoDB.

El nombre de una tabla de DynamoDB es único para una cuenta de AWS, que se identifica con las credenciales de acceso de AWS.

authorization

El comando COPY necesita autorización para acceder a los datos de otro recurso de AWS, incluidos los recursos de Amazon S3, Amazon EMR, DynamoDB y Amazon EC2. Puede proporcionar esa autorización referenciando un rol de AWS Identity and Access Management (IAM) que esté adjunto al clúster (control de acceso basado en roles) o proporcionando las credenciales de acceso de un usuario (control de acceso basado en claves). Para mayor seguridad y flexibilidad, le recomendamos utilizar un control de acceso basado en roles de IAM. Para obtener más información, consulte Parámetros de autorización.

READRATIO [AS] ratio

Se trata del porcentaje del rendimiento aprovisionado de la tabla de DynamoDB para utilizar en la carga de datos. Se requiere READRATIO para utilizar COPY de DynamoDB. No se puede utilizar con COPY de Amazon S3. Le recomendamos encarecidamente establecer la ratio en un valor menor que el rendimiento provisionado sin utilizar promedio. Los valores válidos son números enteros que forman parte del rango 1-200.

importante

Si establece READRATIO en 100 o más permite a Amazon Redshift consumir la totalidad del rendimiento aprovisionado de la tabla de DynamoDB, lo que degrada seriamente el rendimiento de las operaciones de lectura simultáneas que se produzcan en la misma tabla durante la sesión de COPY. El tráfico de escritura no resulta afectado. Los valores superiores a 100 se permiten para solucionar problemas en situaciones raras por las que Amazon Redshift no cumple el rendimiento aprovisionado de la tabla. Si carga datos de DynamoDB en Amazon Redshift de forma continua, considere la posibilidad de organizar las tablas de DynamoDB como series temporales para separar el tráfico activo de la operación COPY.

Parámetros opcionales

Si lo prefiere, puede especificar los siguientes parámetros con COPY de Amazon DynamoDB:

Parámetros no admitidos

No se pueden utilizar los siguientes parámetros con COPY de DynamoDB:

  • Todos los parámetros de formatos de datos

  • ESCAPE

  • FILLRECORD

  • IGNOREBLANKLINES

  • IGNOREHEADER

  • NULL

  • REMOVEQUOTES

  • ACCEPTINVCHARS

  • MANIFEST

  • ENCRYPTED