Modifica della configurazione WLM - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modifica della configurazione WLM

Il modo più semplice per modificare la configurazione WLM consiste nell'usare la console Amazon Redshift. Puoi anche utilizzare l' AWS CLI API o Amazon Redshift.

Quando alterni le impostazioni del cluster tra WLM automatico e manuale, il cluster viene impostato sullo stato pending reboot. La modifica non ha effetto fino al riavvio successivo del cluster.

Per informazioni dettagliate sulla modifica delle configurazioni WLM, consulta Configurazione della gestione del carico di lavoro nella Guida alla gestione di Amazon Redshift.

Migrazione da WLM manuale a WLM automatico

Per massimizzare il troughput di sistema e utilizzare le risorse in modo più efficace, consigliamo la configurazione del WLM automatico per le code. Tieni a mente il seguente approccio per configurare una transizione senza ostacoli dal WLM manuale al WLM automatico.

Per effettuare la migrazione dal WLM manuale al WLM automatico e utilizzare le priorità di query, consigliamo di creare un nuovo gruppo di parametri e di collegarlo al cluster. Per ulteriori informazioni, consulta Gruppi di parametri di Amazon Redshift nella Guida alla gestione di Amazon Redshift.

Importante

Se modifichi il gruppo di parametri o se passi dal WLM manuale al WLM automatico, è necessario riavviare il cluster. Per ulteriori informazioni, consultare Proprietà di configurazione dinamiche e statiche WLM.

Prendiamo un esempio in cui ci sono tre code con WLM manuale. Una coda ciascuna per un carico di lavoro ETL, un carico analitico e uno di data science. Il carico di lavoro ETL viene eseguito ogni 6 ore, quello analitico durante tutto il giorno e il carico di data science può avere picchi in qualsiasi momento. Con il WLM manuale, specifichi la memoria e la simultaneità di ogni coda del carico di lavoro in base all'importanza di ogni carico per il business. Specificare la memoria e la simultaneità non è solo difficile da immaginare, ma produce anche un partizionamento statico delle risorse del cluster, che vengono così sprecate se è in esecuzione solo un sottoinsieme dei carichi di lavoro.

Puoi utilizzare il WLM automatico con priorità di query per indicare le priorità relative dei carichi di lavoro, evitando i problemi precedenti. Per questo esempio, effettua la procedura riportata di seguito:

  • Creare un nuovo parametro e passare alla modalità Auto WLM (WLM automatico).

  • Aggiungere code per ognuno dei tre carichi di lavoro: ETL, analitico e di data science. Utilizzare gli stessi gruppi di utenti per ogni carico di lavoro che è stato utilizzato con modalità Manual WLM (WLM manuale).

  • Impostare la priorità per il carico di lavoro ETL su High, del carico di lavoro analitico su Normal e di quello di data science su Low. Tali priorità rispecchiano le priorità aziendali dei diversi carichi di lavoro o gruppi di utenti.

  • Opzionalmente, si può abilitare il dimensionamento simultaneo per la coda del carico di lavoro analitico o di data science in modo che le query in queste code raggiungano prestazioni coerenti anche quando il carico di lavoro ETL viene eseguito ogni 6 ore.

Con le priorità di query, quando solo il carico di lavoro analitico è in esecuzione nel cluster, riceve tutte le risorse. Ciò garantisce una velocità di trasmissione effettiva elevata con un migliore utilizzo del sistema. Tuttavia, quando si avvia il carico di lavoro ETL, questo ha la precedenza, dal momento che ha una priorità maggiore. Le query eseguite come parte del carico di lavoro ETL hanno la priorità durante l'ammissione oltre a un'allocazione preferenziale delle risorse dopo l'ammissione. Di conseguenza, il carico di lavoro ETL ottiene prestazioni prevedibili indipendentemente da qualsiasi altra operazione in esecuzione nel sistema. Le prestazioni prevedibili di un carico di lavoro con priorità elevata sono disponibili a scapito di altri carichi di lavoro con priorità minore che vengono eseguiti per un tempo più lungo, perché le query attendono il completamento di query più importanti. Oppure perché ricevono una frazione più piccola di risorse quando vengono eseguite simultaneamente a query con priorità maggiore. Gli algoritmi di pianificazione utilizzati da Amazon Redshift fanno in modo che le query con priorità minori non soffrano di un uso scarso delle risorse, ma che continuino ad avanzare, seppure a un ritmo più lento.

Nota
  • Il campo timeout non è disponibile nel WLM automatico. Utilizza invece la regola QMR, query_execution_time. Per ulteriori informazioni, consultare Regole di monitoraggio delle query WLM.

  • L'operazione QMR, HOP, non è applicabile al WLM automatico. Utilizza invece l'operazione change priority. Per ulteriori informazioni, consulta Regole di monitoraggio delle query WLM.

  • I cluster utilizzano le code WLM automatiche e manuali in modo diverso, il che può creare confusione con le configurazioni. Ad esempio, è possibile configurare la proprietà di priorità nelle code WLM automatiche ma non nelle code WLM manuali. Per questo motivo, all'interno di un gruppo di parametri è preferibile evitare il mix tra code WLM automatiche e code WLM manuali. Crea invece un nuovo gruppo di parametri durante la migrazione al WLM automatico.