Elección de la clave de clasificación recomendada - Amazon Redshift

Elección de la clave de clasificación recomendada

Amazon Redshift almacena los datos en el disco en un determinado orden en función de la clave de ordenación. El optimizador de consultas de Amazon Redshift utiliza la ordenación cuando determina cuáles son los planes óptimos de consulta.

nota

Cuando utiliza la optimización automática de tablas, no necesita elegir la clave de ordenación de la tabla. Para obtener más información, consulte Uso de la optimización automática de tablas.

A continuación, se indican algunas sugerencias para lograr el mejor enfoque posible:

  • Para que Amazon Redshift elija el orden adecuado, especifique AUTO en la clave de ordenación.

  • Si los datos recientes se consultan con más frecuencia, especifique la columna de marca temporal como la columna inicial para la clave de ordenación.

    Las consultas son más eficientes debido a que pueden omitir bloques enteros que se encuentran fuera del intervalo de tiempo.

  • Si utiliza filtros de igualdad o por rango con frecuencia en una columna, especifique esa columna como la clave de ordenación.

    Amazon Redshift puede omitir la lectura de bloques completos de datos de esa columna. Puede realizar esta operación porque realiza un seguimiento de los valores de columna mínimos y máximos almacenados en cada bloque y puede omitir los bloques que no se aplican al rango de predicados.

  • Si combina tablas con frecuencia, especifique la columna de combinación como clave de ordenación y clave de distribución.

    Esto permite que el optimizador de consultas seleccione una combinación de fusión y ordenación, en lugar de una combinación hash más lenta. Debido a que los datos ya están ordenados en la clave de combinación, el optimizador de consultas puede omitir la fase de ordenación de la combinación de fusión y ordenación.