Modificar a configuração do WLM - Amazon Redshift

Modificar a configuração do WLM

A maneira mais fácil de modificar a configuração do WLM é usando o console do Amazon Redshift. Você também pode usar a AWS CLI ou a API do Amazon Redshift.

Ao alternar o cluster entre WLM automático e manual, ele é colocado no estado pending reboot. A alteração não entra em vigor até que o próximo cluster seja reinicializado.

Para obter informações detalhadas sobre como modificar as configurações do WLM, consulte “Configurar o gerenciamento de workload” no Guia de gerenciamento de clusters do Amazon Redshift.

Migrar do WLM manual para o WLM automático

Para maximizar a taxa de transferência do sistema e usar os recursos de maneira mais efetiva, recomendamos que você configure o WLM automático para as filas. Considere adotar a abordagem a seguir para configurar uma transição tranquila do WLM manual para o WLM automático.

Para migrar de WLM manual para WLM automático e usar prioridades de fila, recomendamos que você crie um grupo de parâmetros e anexe-o ao cluster. Para obter mais informações, consulte “Grupos de parâmetros do Amazon Redshift” no Guia de gerenciamento de clusters do Amazon Redshift.

Importante

Alterar o grupo de parâmetros ou mudar de WLM manual para automático exige uma reinicialização do cluster. Para ter mais informações, consulte Propriedades de configuração dinâmicas e estáticas do WLM.

Vamos ver um exemplo no qual há três filas manuais do WLM. Uma para uma workload de ETL, outra para uma workload de análise e mais uma para uma workload de ciência de dados. O workload de ETL é executado a cada 6 horas, o workload de análise é executado durante todo o dia e o workload de ciência de dados pode apresentar períodos de pico a qualquer momento. Com o WLM manual, especifique a memória e a simultaneidade que cada fila de workload obtém com base na sua compreensão da importância de cada uma delas para os negócios. A especificação da memória e da simultaneidade não é só difícil de descobrir, mas também faz com que os recursos do cluster sejam particionados estaticamente e, portanto, sejam desperdiçados quando somente um subconjunto das workloads está em execução.

É possível usar o WLM automático com prioridades de consulta para indicar as prioridades relativas dos workloads, evitando os problemas anteriores. Para este exemplo, siga as seguintes etapas:

  • Crie um grupo de parâmetros e alterne para o modo Auto WLM (WLM automático).

  • Adicione filas para cada uma das três workloads: workload de ETL, workload de análise e workload de ciência de dados. Use os mesmos grupos de usuários para cada workload usado com o modo Manual WLM (WLM manual).

  • Defina a prioridade para o workload de ETL como High, a do workload de análise como Normal e a de ciência de dados como Low. Essas prioridades refletem as prioridades de seus negócios para as diferentes workloads ou grupos de usuários.

  • Opcionalmente, habilite a escalabilidade da simultaneidade para a fila de análise ou de ciência de dados para que as consultas nessas filas obtenham uma performance consistente, mesmo quando a workload de ETL estiver sendo executada a cada 6 horas.

Com as prioridades de consulta, quando somente a workload de análise estiver em execução no cluster, ela obterá o sistema todo para si mesma. Isso gera alto throughput com melhor utilização do sistema. No entanto, quando o workload de ETL é iniciado, ele obtém a precedência, já que tem uma prioridade maior. As consultas em execução como parte da workload de ETL obtêm prioridade durante a admissão, além de alocação de recursos preferencial após serem admitidas. Como consequência, o workload de ETL é executado de maneira previsível, independentemente do que mais possa estar sendo executado no sistema. A performance previsível para uma workload de alta prioridade ocorre em detrimento de outra. As workloads de baixa prioridade que são executadas por mais tempo, seja porque as consultas estão aguardando que consultas mais importantes sejam concluídas. Ou porque eles estão recebendo uma fração menor de recursos quando são executados simultaneamente com consultas de prioridade mais alta. Os algoritmos de programação usados pelo Amazon Redshift possibilitam que as consultas de prioridade mais baixa não sofram de inanição, mas continuem progredindo, embora em um ritmo mais lento.

nota
  • O campo de tempo limite não está disponível para WLM automático. Em vez disso, use a regra QMR, query_execution_time. Para ter mais informações, consulte Regras de monitoramento de consulta do WLM.

  • A ação de QMR, HOP, não se aplica a WLM automático. Em vez disso, use a ação change priority. Para ter mais informações, consulte Regras de monitoramento de consulta do WLM.

  • Os clusters usam filas do WLM automático e do WLM manual de forma diferente, o que pode causar confusão com suas configurações. Por exemplo, você pode configurar a propriedade de prioridade em filas do WLM automático, mas não em filas do WLM manual. Dessa forma, evite misturar filas do WLM automático e filas do WLM manual em um grupo de parâmetros. Em vez disso, crie outro grupo de parâmetros ao migrar para o WLM automático.