Scelta della migliore chiave di ordinamento - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scelta della migliore chiave di ordinamento

Amazon Redshift archivia i dati sul disco nell'ordine stabilito dalla chiave di ordinamento. L'ottimizzatore di query Amazon Redshift utilizza tale ordinamento per determinare i piani di query ottimali.

Nota

Quando si utilizza l'ottimizzazione automatica della tabella, non è necessario scegliere la chiave di ordinamento della tabella. Per ulteriori informazioni, consultare Utilizzo dell'ottimizzazione automatica delle tabelle.

Seguono alcuni suggerimenti per l'approccio migliore:

  • Per fare in modo che Amazon Redshift scelga l'ordinamento appropriato, specificare AUTO per la chiave di ordinamento.

  • Se i dati recenti vengono sottoposti a query più di frequente, specifica la colonna timestamp come colonna principale per la chiave di ordinamento.

    Le query sono più efficaci in quanto possono ignorare interi blocchi che non rientrano nell'intervallo di tempo.

  • Se applichi spesso filtri di intervallo o di uguaglianza su una colonna, specifica tale colonna come chiave di ordinamento.

    Amazon Redshift può ignorare la lettura di interi blocchi di dati per quella colonna Può farlo perché tiene traccia dei valori di colonna minimi e massimi archiviati su ogni blocco e può ignorare i blocchi non applicabili all'intervallo di predicati.

  • Se si esegue spesso il join di una tabella, specificare la colonna join come chiave di ordinamento e chiave di distribuzione.

    In questo modo, si consente all'ottimizzatore di query di scegliere un sort merge join anziché un hash join più lento. Poiché i dati sono già ordinati nella chiave di join, l'ottimizzatore di query può bypassare la fase di ordinamento del sort merge join.