Trabajo con escalado de simultaneidad - Amazon Redshift

Trabajo con escalado de simultaneidad

Con la característica de escalado de simultaneidad, puede admitir miles de consultas y usuarios simultáneos con un rendimiento rápido de las consultas en todo momento. Cuando activa el escalado de simultaneidad, Amazon Redshift agrega capacidad al clúster de manera automática para procesar un aumento de las consultas de lectura y escritura. Los usuarios ven siempre los datos más actualizados, tanto si las consultas se ejecutan en el clúster principal como si se ejecutan en un clúster de escalado de simultaneidad.

Puede administrar qué consultas se envían al clúster de escalado de simultaneidad a través de la configuración de colas de WLM. Cuando activa el escalado de simultaneidad, las consultas que cumplen los requisitos necesarios se envían al clúster de escalado de simultaneidad en lugar de esperar en una cola.

Solo se le cobrará el tiempo durante el que los clústeres de escalado de simultaneidad estén ejecutando consultas. Para obtener más información sobre los precios, incluido el modo en que se reparten los cargos y los cargos mínimos, consulte Precios de escalado simultáneo.

Capacidades de escalado de simultaneidad

Cuando activa el escalado de simultaneidad para una cola de WLM, funciona para operaciones de lectura, como consultas de paneles. También funciona para operaciones de escritura de uso común, como instrucciones para la ingesta y el procesamiento de datos.

Capacidades de escalado de simultaneidad para las operaciones de escritura

El escalado de simultaneidad admite operaciones de escritura frecuentes, como instrucciones de extracción, transformación y carga (ETL). El escalado de simultaneidad para operaciones de escritura es especialmente útil si desea mantener tiempos de respuesta constantes cuando el clúster reciba un gran número de solicitudes. Mejora el rendimiento de las operaciones de escritura que compiten por los recursos en el clúster principal.

El escalado de simultaneidad admite las instrucciones COPY, INSERT, DELETE, UPDATE y CREATE TABLE AS (CTAS). Además, el escalado de simultaneidad admite la actualización de la vista materializada para las máquinas virtuales que no utilizan agregaciones. No se admiten otras instrucciones de lenguaje de manipulación de datos (DML) ni de lenguaje de definición de datos (DDL). Si las instrucciones de escritura no compatibles, como CREATE sin TABLE AS, se incluyen en una transacción explícita antes de las instrucciones de escritura admitidas, ninguna de las instrucciones de escritura se ejecutará en clústeres escalados simultáneamente.

Cuando acumula crédito para el escalado de concurrencia, esta acumulación se aplica a las operaciones de lectura y escritura

Limitaciones para el escalado de simultaneidad

A continuación, se detallan las limitaciones para utilizar el escalado de simultaneidad de Amazon Redshift:

  • No admite consultas en tablas con claves de ordenación intercalada.

  • No admite consultas en tablas temporales.

  • No admite consultas que acceden a recursos externos protegidos por configuraciones de redes restrictivas o nubes virtuales privadas (VPC).

  • No admite consultas que contengan funciones definidas por el usuario (UDF) de Python ni UDF de Lambda.

  • No admite consultas que acceden a tablas de sistema, tablas de catálogo de PostgreSQL o tablas sin copias de seguridad.

  • No admite consultas COPY o UNLOAD con acceso a un recurso externo cuando existen permisos de políticas de IAM restrictivas. Esto incluye permisos aplicados al recurso, como un bucket de Amazon S3 o tabla de DynamoDB, o al origen. Los orígenes de IAM pueden incluir los siguientes:

    • aws:sourceVpc: una VPC de origen.

    • aws:sourceVpce: un punto de conexión de VPC de origen.

    • aws:sourceIp: una dirección IP de origen.

    En algunos casos, es posible que necesite eliminar permisos que restringen el recurso o el origen, por lo que las consultas COPY y UNLOAD con acceso al recurso se envían al clúster de escalado de simultaneidad.

    Para obtener más información sobre las políticas de recursos, consulte Tipos de políticas en la guía del usuario de AWS Identity and Access Management y Cómo controlar el acceso desde los puntos de conexión de VPC con políticas de bucket.

  • En las operaciones de DDL, como CREATE TABLE o ALTER TABLE, no se admite el escalado de simultaneidad de Amazon Redshift para operaciones de escritura.

  • No admite ANALYZE para el comando COPY.

  • No admite operaciones de escritura en una tabla de destino donde DISTSTYLE se configura como ALL.

  • No admite COPY de los siguientes formatos de archivo:

    • Parquet

    • ORC

  • No admite operaciones de escritura en tablas con columnas de identidad.

  • Amazon Redshift admite el escalado de simultaneidad para operaciones de escritura solo en nodos RA3 de Amazon Redshift, específicamente ra3.16xlarge, ra3.4xlarge y ra3.xlplus. El escalado de simultaneidad para operaciones de escritura no es compatible con otros tipos de nodos.

Para obtener más información acerca del escalado de simultaneidad, consulte los siguientes temas en la Guía de administración de Amazon Redshift.