Visualizar dados de performance do cluster - Amazon Redshift

Visualizar dados de performance do cluster

Ao usar métricas de cluster no Amazon Redshift, você pode fazer as seguintes tarefas de performance comuns:

  • Determine se as métricas de cluster são anormais em um período especificado e, em caso afirmativo, identifique as consultas responsáveis pela ocorrência de performance.

  • Verifique se as consultas históricas ou atuais estão afetando a performance do cluster. Se identificar uma consulta problemática, você poderá visualizar detalhes sobre ela, incluindo a performance do cluster durante a execução da consulta. Você pode usar essas informações para diagnosticar o motivo da lentidão da consulta e ver o que pode ser feito para melhorar a performance dela.

Para visualizar os dados de performance
  1. Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshiftv2/.

  2. No menu de navegação, escolha Clusters e, em seguida, o nome de um cluster na lista para abrir os detalhes. Os detalhes do cluster são exibidos, incluindo as guias Performance do cluster, Monitoramento de consultas, Banco de dados, Datashares, Programações, Manutenção e Propriedades.

  3. Escolha a guia Cluster performance (Performance do cluster) para obter informações que incluem o seguinte:

    • Utilização da CPU

    • Percentage disk space used (Porcentagem utilizada de espaço em disco)

    • Conexões de banco de dados

    • Status de integridade

    • Query duration (Duração de consultas)

    • Query throughput (Taxa de transferência de consultas)

    • Ação de escalabilidade da simultaneidade

    Muitas métricas novas estão disponíveis. Para ver as métricas disponíveis e escolher quais são exibidas, escolha o ícone Preferences (Preferências)

Gráficos de performance de cluster

Os exemplos a seguir mostram alguns dos gráficos exibidos no novo console do Amazon Redshift.

  • Utilização da CPU – Mostra a porcentagem de utilização da CPU para todos os nós (líder e computação). Para localizar um horário em que o uso do cluster seja mais baixo antes de agendar a migração do cluster ou outras operações que consomem recursos, monitore este gráfico para ver a utilização da CPU por nó individual ou por todos os nós.

    Uma imagem do gráfico de utilização da CPU no console do Amazon Redshift que mostra a porcentagem de utilização da CPU para cada nó.
  • Modo de manutenção – Mostra se o cluster está no modo de manutenção em um horário escolhido usando os indicadores On e Off. É possível ver a hora em que o cluster está passando por manutenção. Depois, é possível correlacionar esse tempo com as operações realizadas no cluster para estimar seus tempos de inatividade futuros para eventos recorrentes.

    Uma imagem do gráfico no console do Amazon Redshift que mostra se o modo de manutenção é On ou Off.
  • Porcentagem de espaço em disco usado – Mostra a porcentagem de uso de espaço em disco por cada nó de computação, e não para o cluster como um todo. É possível explorar esse gráfico para monitorar a utilização do disco. Operações de manutenção, como VACUUM e COPY, usam espaço de armazenamento temporário intermediário para suas operações de classificação, portanto, é esperado um pico no uso do disco.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a porcentagem do espaço em disco para cada nó.
  • Taxa de transferência de leitura – Mostra o número médio de megabytes lidos do disco por segundo. É possível avaliar esse gráfico para monitorar o aspecto físico correspondente do cluster. Essa taxa de transferência não inclui o tráfego de rede entre instâncias no cluster e o seu volume.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o throughput de leitura para cada nó.
  • Latência de leitura – Mostra a quantidade média de tempo gasto para operações de E/S de leitura de disco por milissegundo. É possível visualizar os tempos de resposta dos dados a serem retornados. Quando a latência é alta, isso significa que o remetente gasta mais tempo ocioso (não enviando novos pacotes), o que reduz a rapidez com que a taxa de transferência aumenta.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a latência de leitura para cada nó.
  • Taxa de transferência de gravação – Mostra o número médio de megabytes gravados no disco por segundo. É possível avaliar essa métrica para monitorar o aspecto físico correspondente do cluster. Essa taxa de transferência não inclui o tráfego de rede entre instâncias no cluster e o seu volume.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o throughput de gravação para cada nó.
  • Latência de gravação – Mostra o tempo médio em milissegundos gasto para operações de E/S de gravação de disco. É possível avaliar o tempo para que a confirmação de gravação seja retornada. Quando a latência é alta, isso significa que o remetente gasta mais tempo ocioso (não enviando novos pacotes), o que reduz a rapidez com que a taxa de transferência aumenta.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a latência de gravação para cada nó.
  • Conexões de banco de dados – Mostra o número de conexões de banco de dados a um cluster. É possível usar esse gráfico para ver quantas conexões são estabelecidas com o banco de dados e encontrar um horário em que o uso do cluster é menor.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o número de conexões do banco de dados com um cluster.
  • Contagem total de tabelas – Mostra o número de tabelas de usuário abertas em um determinado momento dentro de um cluster. É possível monitorar a performance do cluster quando a contagem de tabelas abertas é alta.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a contagem total de tabelas para um cluster.
  • Status de integridade – Indica a integridade do cluster como Healthy ou Unhealthy. Se o cluster puder se conectar ao banco de dados e executar uma consulta simples com êxito, o cluster será considerado íntegro. Caso contrário, o cluster está com problemas. Um status não saudável pode ocorrer quando o banco de dados do cluster está sob carga extremamente pesada ou se houver um problema de configuração com um banco de dados no cluster.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o status de integridade para um cluster.
  • Duração de consultas – Mostra a quantidade média de tempo para concluir uma consulta em microssegundos. É possível comparar os dados nesse gráfico para medir a performance de E/S dentro do cluster e ajustar suas consultas mais demoradas, se necessário.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a duração da consulta para um cluster.
  • Taxa de transferência de consultas – Mostra o número médio de consultas concluídas por segundo. É possível analisar dados nesse gráfico para medir a performance do banco de dados e caracterizar a capacidade do sistema de oferecer suporte a um workload multiusuário de forma equilibrada.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o throughput da consulta para um cluster.
  • Duração de consultas por fila WLM – Mostra a quantidade média de tempo para concluir uma consulta em microssegundos. É possível comparar os dados nesse gráfico para medir a performance de E/S por fila de WLM e ajustar suas consultas mais demoradas, se necessário.

    Uma imagem do gráfico no console do Amazon Redshift que mostra a duração da consulta por fila WLM.
  • Taxa de transferência de consulta por fila WLM – Mostra o número médio de consultas concluídas por segundo. É possível analisar dados nesse gráfico para medir a performance do banco de dados por fila do WLM.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o throughput da consulta por fila WLM.
  • Atividade de escalabilidade de simultaneidade – Mostra o número de clusters de escalabilidade de simultaneidade ativos. Quando a escalabilidade de simultaneidade está habilitado, o Amazon Redshift adiciona automaticamente capacidade de cluster adicional quando você precisa para processar um aumento nas consultas de leitura simultâneas.

    Uma imagem do gráfico no console do Amazon Redshift que mostra o número de clusters da escala de simultaneidade ativos.