Quelles métriques dois-je surveiller ? - Amazon ElastiCache pour Redis

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Quelles métriques dois-je surveiller ?

Les métriques CloudWatch suivantes permettent de mieux connaître les performances ElastiCache. Dans la plupart des cas, nous vous recommandons de définir des alarmes CloudWatch pour ces métriques, afin de pouvoir prendre des actions correctives avant que des problèmes de performance ne se produisent.

CPUUtilization

Il s'agit d'une métrique au niveau de l'hôte représentée en pourcentage. Pour de plus amples informations, veuillez consulter Métriques au niveau de l'hôte.

Pour les types de nœud plus petits avec 2 vCPU ou moins, utilisez la métrique CPUUtilization pour surveiller votre charge de travail.

En général, nous vous suggérons de définir votre seuil à 90 % de votre UC disponible. Comme Redis est à thread unique, la valeur réelle du seuil doit être calculée en tant que fraction de la capacité totale du nœud. Supposons par exemple que vous utilisiez un type de nœud comportant deux cœurs. Dans ce cas, le seuil pour CPUUtilization serait 90/2 ou 45 %.

Vous devez déterminer votre propre seuil, en fonction du nombre de cœurs dans le nœud de cache que vous utilisez. Si vous dépasserez ce seuil, et que les demandes de lecture constituent votre principale charge de travail, ajustez votre cluster de cache en ajoutant des réplicas en lecture. Si la principale charge de travail provient de demandes d'écriture, selon la configuration de votre cluster, nous vous recommandons de :

  • Clusters Redis (lorsque le mode cluster est désactivé) : augmentez l'échelle en utilisant un type d'instance de cache plus grand.

  • Clusters Redis (mode cluster activé) : ajoutez des partitions pour répartir la charge de travail en écriture sur un plus grand nombre de nœuds primaires.

Astuce

Au lieu d'utiliser la métrique au niveau de l'hôte CPUUtilization, les utilisateurs Redis peuvent être en mesure d'utiliser la métrique Redis EngineCPUUtilization qui indique le pourcentage d'utilisation sur le cœur du moteur Redis. Pour plus d'informations et pour savoir si cette métrique est disponible sur vos nœuds, consultez Métriques pour Redis.

Pour les types de nœud plus grands avec 4 vCPU ou plus, vous pouvez souhaiter utiliser la métrique EngineCPUUtilization qui indique le pourcentage d'utilisation sur le cœur du moteur Redis. Pour plus d'informations et pour savoir si cette métrique est disponible sur vos nœuds, consultez Métriques pour Redis.

EngineCPUUtilization

Pour les types de nœud plus grands avec 4 vCPU ou plus, vous pouvez souhaiter utiliser la métrique EngineCPUUtilization qui indique le pourcentage d'utilisation sur le cœur du moteur Redis. Pour plus d'informations et pour savoir si cette métrique est disponible sur vos nœuds, consultez Métriques pour Redis.

Pour plus d'informations, consultez la section CPU dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

SwapUsage

Il s'agit d'une métrique au niveau de l'hôte, publiée en octets. Pour de plus amples informations, veuillez consulter Métriques au niveau de l'hôte.

Si la métrique CloudWatch FreeableMemory est proche de 0 (c. -à-d. inférieure à 100 Mo) ou si la métrique SwapUsage est supérieure à la métrique FreeableMemory, cela indique qu'un nœud est soumis à une pression de mémoire. Si cela se produit, consultez les rubriques suivantes :

Evictions

Il s'agit d'une métrique de moteur de cache. Nous vous recommandons de choisir votre propre seuil d'alarme pour cette métrique en fonction des besoins de votre application.

CurrConnections

Il s'agit d'une métrique de moteur de cache. Nous vous recommandons de choisir votre propre seuil d'alarme pour cette métrique en fonction des besoins de votre application.

Un nombre croissant de CurrConnections peut révéler un problème avec votre application ; vous aurez besoin d'analyser le comportement de l'application pour traiter ce problème.

Pour plus d'informations, consultez la section Connexions dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

Mémoire

La mémoire est un aspect central de Redis. Il est nécessaire de comprendre l'utilisation de la mémoire de votre cluster afin d'éviter la perte de données et de tenir compte de la croissance future de votre jeu de données. Les statistiques sur l'utilisation de la mémoire d'un nœud sont disponibles dans la section mémoire de la commande Redis INFO.

Pour plus d'informations, consultez la rubrique Mémoire dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

Réseau

L'un des facteurs déterminants de la capacité de bande passante réseau de votre cluster est le type de nœud que vous avez sélectionné. Pour plus d'informations sur la capacité réseau de votre nœud, consultez Tarif Amazon ElastiCache.

Pour plus d'informations, consultez la section Réseau dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

Latence

Vous pouvez mesurer la latence d'une commande à l'aide d'un ensemble de métriques CloudWatch qui fournissent des latences agrégées par structure de données. Les métriques de latence répertoriées ci-dessous sont calculées à l'aide des statistiques commandstats de la commande Redis INFO.

Pour plus d'informations, consultez la section Latence dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

Réplication

Le volume de données en cours de réplication est visible via le métrique ReplicationBytes. Bien que cette métrique soit représentative de la charge d'écriture sur le groupe de réplication, elle ne fournit pas d'informations sur l'intégrité de la réplication. Pour ce faire, vous pouvez utiliser la métrique ReplicationLag.

Pour plus d'informations, veuillez consulter la section Réplication dans Surveillance des bonnes pratiques avec Amazon ElastiCache for Redis à l'aide d'Amazon CloudWatch.

Gestion du trafic

ElastiCache for Redis gère automatiquement le trafic sur un nœud lorsque des commandes entrantes supplémentaires sont envoyées au nœud et que Redis peut les traiter. Cela vise à maintenir un fonctionnement et une stabilité optimaux du moteur.

Lorsque le trafic est géré activement sur un nœud, la métrique TrafficManagementActive émet des points de données de valeur 1. Cela indique que le nœud est peut-être sous-dimensionné pour la charge de travail fournie. Si cette métrique reste à 1 sur de longues périodes, évaluez le cluster pour décider s'il est nécessaire de procéder à une augmentation ou à une montée en puissance.

Pour en savoir plus, consultez la métrique TrafficManagementActive sur la page Métriques.