Consideraciones al utilizar las integraciones sin ETL con Amazon Redshift - Amazon Redshift

Consideraciones al utilizar las integraciones sin ETL con Amazon Redshift

Las siguientes consideraciones se aplican a las integraciones sin ETL con Amazon Redshift.

  • El almacenamiento de datos de Amazon Redshift de destino debe cumplir los siguientes requisitos previos:

    • Ejecutar Amazon Redshift sin servidor o un tipo de nodo RA3 (ra3.16xlarge, ra3.4xlarge y ra3.xlplus).

    • Cifrado (si se utiliza un clúster aprovisionado).

    • Distinción entre mayúsculas y minúsculas activada.

  • No puedes habilitar la compatibilidad mejorada con VPC en el almacenamiento de datos con las integraciones configuradas.

  • Si elimina un origen que sea el origen de la integración autorizada para un almacenamiento de datos de Amazon Redshift, todas las integraciones asociadas pasarán al estado FAILED.

  • La base de datos de destino es de solo lectura. No puede crear tablas, vistas ni vistas materializadas en la base de datos de destino. Sin embargo, puede utilizar vistas materializadas en otras tablas del almacenamiento de datos de destino.

  • Las vistas materializadas se admiten cuando se utilizan en consultas entre bases de datos. La actualización de las vistas materializadas con datos replicados a partir de integraciones sin ETL conlleva una actualización completa de la vista. No se admite la actualización incremental, la reescritura automática de consultas, la actualización automática ni las vistas materializadas automatizadas. Para obtener información sobre la creación de vistas materializadas con datos replicados mediante integraciones sin ETL, consulte Creación de vistas materializadas con datos replicados.

  • Solo puede consultar las tablas del almacenamiento de datos de destino que tengan el estado Synced. Para obtener más información, consulte Métricas para integraciones sin ETL.

  • Amazon Redshift solo acepta caracteres UTF-8, por lo que es posible que no respete la intercalación definida en el origen. Las reglas de clasificación y comparación pueden ser diferentes, por lo que, en última instancia, pueden cambiar los resultados de la consulta.

  • La longitud máxima de un tipo de datos VARCHAR de Amazon Redshift es de 65 535 bytes. Si el contenido del origen no se ajusta a este límite, la replicación no continúa y la tabla pasa a un estado fallido. Para obtener más información sobre las diferencias de tipos de datos entre los orígenes de integración sin ETL y las bases de datos de Amazon Redshift, consulte Diferencias de tipos de datos entre las bases de datos Aurora y Amazon Redshift en la Guía del usuario de Amazon Aurora.

  • Las tablas del origen de la integración deben contar con una clave principal. De lo contrario, las tablas no se podrán replicar en el almacenamiento de datos de destino de Amazon Redshift.

    Para obtener información sobre cómo agregar una clave principal a la edición compatible de Aurora PostgreSQL, consulte Handle tables without primary keys while creating Amazon Aurora PostgreSQL zero-ETL integrations with Amazon Redshift en el Blog de la base de datos de AWS. Para obtener información sobre cómo agregar una clave principal a Amazon Aurora MySQL o RDS para MySQL, consulte Handle tables without primary keys while creating Amazon Aurora MySQL or Amazon RDS for MySQL zero-ETL integrations with Amazon Redshift en el Blog de la base de datos de AWS.

  • Para las integraciones sin ETL de Aurora PostgreSQL y RDS para MySQL con Amazon Redshift, cree el almacenamiento de datos de destino en Vista previa. Para obtener más información, consulte Creación y configuración de un almacenamiento de datos de Amazon Redshift de destino.

  • La integración sin ETL no admite transformaciones al replicar los datos de los almacenes de datos transaccionales a Amazon Redshift. Los datos se replican tal cual desde la base de datos de origen. Sin embargo, puede aplicar transformaciones a los datos replicados en Amazon Redshift.

  • Esto puede afectar a otras cargas de trabajo que se ejecutan en Amazon Redshift. Para eliminar el impacto de la integración sin ETL en otras cargas de trabajo, considere la posibilidad de utilizar un punto de conexión independiente para la integración sin ETL y comparta los datos con otros puntos de enlace que necesiten acceder a estos datos mediante el recurso compartido de datos.

  • La integración sin ETL se ejecuta en Amazon Redshift mediante conexiones paralelas. Se ejecuta con las credenciales del usuario que creó la base de datos a partir de la integración. Cuando se ejecuta la consulta, el escalado de simultaneidad no se activa para estas conexiones durante la sincronización (escrituras). Las lecturas de escalado simultáneo (de los clientes de Amazon Redshift) funcionan para los objetos sincronizados.

Para las consideraciones que también se aplican al origen de integración, consulte uno de los siguientes temas:

  • Para los orígenes de Aurora, consulte Limitaciones en la Guía del usuario de Amazon Aurora.

  • Para los orígenes de Amazon RDS, consulte Limitaciones en la Guía del usuario de Amazon Aurora.