Quais métricas devo monitorar? - Amazon MemoryDB

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Quais métricas devo monitorar?

As CloudWatch métricas a seguir oferecem uma boa visão do desempenho do MemoryDB. Na maioria dos casos, recomendamos que você defina CloudWatch alarmes para essas métricas para que você possa tomar medidas corretivas antes que ocorram problemas de desempenho.

CPUUtilization

Essa é uma métrica em nível de host relatada como uma porcentagem. Para ter mais informações, consulte Métricas em nível de host.

Para tipos de nós menores com 2 vCPUs ou menos, use a métrica CPUUtilization para monitorar a workload.

De modo geral, sugerimos que você defina o limite para 90% da CPU disponível. Como o Redis OSS é de um único segmento, o valor limite real deve ser calculado como uma fração da capacidade total do nó. Por exemplo, suponha que você esteja usando um tipo de nó com dois núcleos. Nesse caso, o limite para CPUUtilization seria 90/2 ou 45%. Para saber o número de núcleos (vCPUs) que seu tipo de nó possui, consulte Precificação do MemoryDB.

Você precisará determinar seu próprio limite, com base no número de núcleos no nó que está usando. Se você exceder esse limite e sua workload principal for de solicitações de leitura, escale seu cluster adicionando réplicas de leitura. Se a workload principal for proveniente de solicitações de gravação, recomendamos que você adicione mais fragmentos para distribuir a workload de gravação em mais nós primários.

dica

Em vez de usar a métrica Host-LevelCPUUtilization, talvez você possa usar a métrica Redis OSSEngineCPUUtilization, que relata a porcentagem de uso no núcleo do mecanismo Redis OSS. Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para MemoryDB.

Para tipos de nós maiores com 4 vCPUs ou mais, talvez você queira usar a EngineCPUUtilization métrica, que relata a porcentagem de uso no núcleo do mecanismo Redis OSS. Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para MemoryDB.

EngineCPUUtilization

Para tipos de nós maiores com 4 vCPUs ou mais, talvez você queira usar a EngineCPUUtilization métrica, que relata a porcentagem de uso no núcleo do mecanismo Redis OSS. Para ver se essa métrica está disponível em seus nós e para obter mais informações, consulte Métricas para MemoryDB.

SwapUsage

Esta é uma métrica em nível de host relatada em bytes. Para ter mais informações, consulte Métricas em nível de host.

essa métrica não deve exceder 50 MB.

Evictions

Essa é uma métrica de mecanismo. Recomendamos que você determine seu próprio limite de alarme para essa métrica com base nas necessidades do seu aplicativo.

CurrConnections

Essa é uma métrica de mecanismo. Recomendamos que você determine seu próprio limite de alarme para essa métrica com base nas necessidades do seu aplicativo.

Um número crescente de CurrConnectionspode indicar um problema com seu aplicativo; você precisará investigar o comportamento do aplicativo para resolver esse problema.

Memória

A memória é um aspecto central do Redis OSS. Compreender a utilização da memória do seu cluster é necessário para evitar a perda de dados e acomodar o crescimento futuro do seu conjunto de dados. As estatísticas sobre a utilização da memória de um nó estão disponíveis na seção de memória do comando Redis OSS INFO.

Rede

Um dos fatores determinantes para a capacidade de largura de banda da rede do cluster é o tipo de nó selecionado. Para obter mais informações sobre a capacidade de rede de seu nó, consulte Precificação do Amazon MemoryDB.

Replicação

O volume de dados que está sendo replicado é visível através da métrica ReplicationBytes. Você pode monitorar o MaxReplicationThroughput em relação ao throughput da capacidade de replicação. Recomenda-se adicionar mais fragmentos ao atingir o throughput máximo da capacidade de replicação.

ReplicationDelayedWriteCommands também pode indicar se a workload está excedendo o throughput da capacidade máxima de replicação. Para obter mais informações sobre a replicação no MemoryDB, consulte Entendendo a replicação do MemoryDB