Visualizar anomalias reativas - AmazonDevOps Guru

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar anomalias reativas

Com um insight, você pode visualizar anomalias dos recursos do Amazon RDS. Em uma página de insights reativos, na seção Métricas agregadas, você pode ver uma lista de anomalias com os cronogramas correspondentes. Também há seções que exibem informações sobre grupos de registros e eventos relacionados às anomalias. Cada uma das anomalias causais em uma visão reativa tem uma página correspondente com detalhes sobre a anomalia.

Visualizando a análise detalhada de uma anomalia reativa do RDS

Nesta etapa, analise detalhadamente a anomalia para obter análises e recomendações detalhadas para suas instâncias de banco de dados Amazon RDS.

A análise detalhada só está disponível para instâncias de banco de dados Amazon RDS que tenham o Performance Insights ativado.

Para detalhar a página de detalhes da anomalia
  1. Na página de insights, encontre uma métrica agregada com o tipo de recurso AWS/RDS.

  2. Escolha View details (Exibir detalhes).

    A página de detalhes da anomalia é exibida. O título começa com Anomalia de desempenho do banco de dados e nomeia o recurso como mostrado. O console usa como padrão a anomalia com a maior severidade, independentemente de quando a anomalia ocorreu.

  3. (Opcional) Se vários recursos forem afetados, escolha um recurso diferente na lista na parte superior da lista.

Veja a seguir descrições dos componentes da página de detalhes.

Visão geral dos recursos

A seção superior da página de detalhes é Visão geral dos recursos. Esta seção resume a anomalia de desempenho da sua instância de banco de dados do Amazon RDS.


                        Visão geral da página de detalhes da anomalia

Esta seção tem os seguintes campos:

  • Nome do recurso: o nome da instância de banco de dados que está enfrentando a anomalia. Neste exemplo, o recurso é denominado prod_db_678.

  • Mecanismo de banco de dados — O nome da instância de banco de dados que está enfrentando a anomalia. Neste exemplo, o mecanismo é o Aurora MySQL.

  • Gravidade da anomalia — A medida do impacto negativo da anomalia em sua instância. As severidades possíveis são Alta, Média e Baixa.

  • Resumo da anomalia — Um breve resumo do problema. Um resumo típico é uma carga de banco de dados excepcionalmente alta.

  • Hora de início e hora de término — A hora em que a anomalia começou e terminou. Se o horário de término estiver em andamento, a anomalia ainda está ocorrendo.

  • Duração — A duração do comportamento anômalo. Neste exemplo, a anomalia está em andamento e está ocorrendo há 3 horas e 2 minutos.

Métrica primária

A seção Métrica primária resume a anomalia casual, que é a anomalia de nível superior dentro do insight. Você pode pensar na anomalia causal como o problema geral enfrentado pela sua instância de banco de dados.


                        A seção O que encontramos da página de detalhes da anomalia

O painel esquerdo fornece mais detalhes sobre o problema. Neste exemplo, o resumo inclui as seguintes informações:

  • Carga do banco de dados (carga de banco de dados) — Uma categorização da anomalia como um problema de carregamento do banco de dados. A métrica correspondente no Performance Insights éDBLoad. Essa métrica também é publicada na Amazon CloudWatch.

  • db.r5.4xlarge: a classe de instância de banco de dados. O número de vCPUs, que é 16 neste exemplo, corresponde à linha pontilhada no gráfico de sessões ativas médias (AAS).

  • 24 (pico de 6x) — A carga de banco de dados, medida na média de sessões ativas (AAS) durante o intervalo de tempo relatado no insight. Assim, a qualquer momento durante o período da anomalia, uma média de 24 sessões estavam ativas no banco de dados. A carga do banco de dados é 6 vezes a carga normal do banco de dados para essa instância.

  • Normalmente: carga de banco de dados de até 4 — A linha de base da carga de banco de dados, medida em AAS, durante uma carga de trabalho típica. O valor 4 significa que, durante as operações normais, uma média de 4 ou menos sessões estão ativas no banco de dados a qualquer momento.

Por padrão, o gráfico de carga é dividido por eventos de espera. Isso significa que, para cada barra no gráfico, a maior área colorida representa o evento de espera que está contribuindo mais para a carga total do banco de dados. O gráfico mostra a hora (em vermelho) em que o problema começou. Concentre sua atenção nos eventos de espera que ocupam mais espaço no bar:

  • CPU

  • IO:wait/io/sql/table/handler

Os eventos de espera anteriores parecem mais do que o normal para esse banco de dados Aurora MySQL. Para saber como Ajustar eventos de espera no Amazon Aurora MySQL, consulte Ajustar eventos de espera para o MySQL, no Guia do usuário do Amazon Aurora PostgreSQL, no Guia do usuário do Amazon Aurora MySQL. Para saber como ajustar o desempenho usando eventos de espera no RDS para PostgreSQL, consulte Ajuste com eventos de espera para RDS para PostgreSQL no Guia do usuário do Amazon RDS.

Métricas relacionadas

A seção Métricas relacionadas lista as anomalias contextuais, que são descobertas específicas dentro da anomalia causal. Essas descobertas fornecem informações adicionais sobre os problemas de desempenho.


                        A seção Métricas relacionadas da página de detalhes

A tabela de métricas relacionadas tem duas colunas: Nome da métrica e Cronograma (UTC). Cada linha na tabela corresponde a uma métrica específica.

A primeira coluna de cada linha tem as seguintes informações:

  • Nome — O nome da métrica. A primeira linha identifica a métrica como tarefas de execução da CPU.

  • Atualmente — O valor atual da métrica. Na primeira linha, o valor atual é 162 processos (3x).

  • Normalmente — A linha de base dessa métrica para esse banco de dados quando ele está funcionando normalmente. DevOpsO Guru for RDS calcula a linha de base como o valor do 95º percentil em 1 semana de história. A primeira linha indica que 56 processos normalmente estão sendo executados na CPU.

  • Contribuindo para — A descoberta associada a essa métrica. Na primeira linha, a métrica de tarefas de execução da CPU está associada à anomalia da capacidade da CPU excedida.

A coluna Cronograma mostra um gráfico de linhas para a métrica. A área sombreada mostra o intervalo de tempo em que o DevOps Guru for RDS designou a descoberta como de alta severidade.

Análise e recomendações

Enquanto a anomalia causal descreve o problema geral, uma anomalia contextual descreve uma descoberta específica que requer investigação. Cada descoberta corresponde a um conjunto de métricas relacionadas.

No exemplo a seguir de uma seção de análise e recomendações, a anomalia de alta carga de banco de dados tem duas descobertas.


                        A seção Análise e recomendações da página de detalhes

A tabela tem as seguintes colunas:

  • Anomalia — Uma descrição geral dessa anomalia contextual. Neste exemplo, a primeira anomalia são eventos de espera de alta carga e a segunda é a capacidade da CPU excedida.

  • Análise — Uma explicação detalhada da anomalia.

    Na primeira anomalia, três tipos de espera contribuem para 90% da carga do banco de dados. Na segunda anomalia, a fila de execução da CPU ultrapassou 150, o que significa que, a qualquer momento, mais de 150 sessões estavam aguardando o tempo de CPU. A utilização da CPU foi superior a 97%, o que significa que, durante o problema, a CPU estava ocupada 97% do tempo. Assim, a CPU estava quase continuamente ocupada enquanto uma média de 150 sessões aguardavam para ser executadas na CPU.

  • Recomendações — A resposta sugerida do usuário à anomalia.

    Na primeira anomalia, o DevOps Guru for RDS recomenda que você investigue os eventos de esperacpuio/table/sql/handler e. Para saber como ajustar o desempenho do seu banco de dados com base nesses eventos, consulte cpu e io/table/sql/handler no Guia do usuário do Amazon Aurora.

    Na segunda anomalia, o DevOps Guru for RDS recomenda que você reduza o consumo de CPU ajustando três instruções SQL. Você pode passar o mouse sobre os links para ver o texto do SQL.

  • Métricas relacionadas — Métricas que fornecem medidas específicas para a anomalia. Para obter mais informações sobre essas métricas, consulte Referência de métricas para o Amazon Aurora no Guia do usuário do Amazon Aurora ou Referência de métricas para o Amazon RDS no Guia do usuário do Amazon RDS.

    Na primeira anomalia, o DevOps Guru for RDS recomenda comparar a carga do banco de dados com a CPU máxima da sua instância. Na segunda anomalia, a recomendação é analisar a fila de execução da CPU, a utilização da CPU e a taxa de execução do SQL.