Dimensionnement de votre cluster DAX à l'aide des données de surveillance

Surveillance de DAX

Vous pouvez surveiller les indicateurs clés, tels que le taux d'accès au cache, afin de garantir des performances optimales du cluster DAX, de diagnostiquer les problèmes et de déterminer à quel moment vous devez redimensionner le cluster. La vérification régulière des indicateurs clés vous aide à maintenir les performances, la stabilité et la rentabilité en adaptant le cluster aux exigences de votre charge de travail. Pour plus d'informations sur la surveillance du DAX, consultezSurveillance en production.

La liste suivante présente certains des indicateurs clés que vous devez surveiller :

Taux de réussite du cache : indique l'efficacité avec laquelle DAX traite les données mises en cache, réduisant ainsi le besoin d'accéder aux tables DynamoDB sous-jacentes. Quelques erreurs de cache pour le cluster indiquent une bonne efficacité de la mise en cache. Cependant, quelques accès au cache suggèrent que vous devrez peut-être revoir le paramètre TTL de mise en cache, sinon la charge de travail ne convient pas à la mise en cache.

Utilisez Amazon CloudWatch pour calculer le taux d'accès au cache de votre cluster DAX. Comparez les QueryCacheMisses indicateurs ItemCacheHitsItemCacheMisses,QueryCacheHits, et pour obtenir ce ratio. La formule suivante indique comment le taux d'accès au cache est calculé. Pour calculer le ratio à l'aide de cette formule, divisez le nombre d'accès au cache par la somme des accès et des échecs.
```
Cache hit ratio = Cache hits / (Cache hits + Cache misses)
```
Le taux de réussite du cache est un nombre compris entre 0 et 1, représenté sous forme de pourcentage. Un pourcentage plus élevé indique une meilleure utilisation globale du cache.
ErrorRequestCount— Nombre de demandes ayant entraîné des erreurs utilisateur signalées par le nœud ou le cluster. ErrorRequestCountinclut les demandes qui ont été limitées par le nœud ou le cluster. La surveillance des erreurs des utilisateurs peut vous aider à identifier les erreurs de dimensionnement ou item/partition les modèles récurrents dans votre application.
Latences opérationnelles — La surveillance de la latence des opérations de lecture et d'écriture vers et depuis le cluster DAX peut vous aider à identifier les goulots d'étranglement liés aux performances. L'augmentation des latences peut indiquer des problèmes liés à la configuration de votre cluster DAX, à votre réseau ou à la nécessité d'une mise à l'échelle.
Consommation réseau : surveillez les NetworkBytesOut indicateurs NetworkBytesIn et les indicateurs pour surveiller le trafic réseau de votre cluster DAX. Une augmentation inattendue du débit du réseau peut entraîner une augmentation du nombre de demandes des clients ou des modèles de requêtes inefficaces entraînant le transfert d'une plus grande quantité de données.

La surveillance de la consommation du réseau vous aide à gérer les coûts de votre cluster DAX. Cela garantit également que le réseau ne devienne pas un goulot d'étranglement pour les performances du cluster.
Taux d'expulsion : indique la fréquence à laquelle des objets sont retirés de votre cache pour faire de la place à de nouveaux objets. Si le taux d'expulsion augmente au fil du temps, votre cache est peut-être trop petit ou votre stratégie de mise en cache n'est pas efficace.

Surveillez la EvictedSize métrique CloudWatch pour déterminer si la taille de votre cache est adaptée à votre charge de travail. Si la taille totale expulsée ne cesse de croître, vous devrez peut-être agrandir votre cluster DAX pour qu'il puisse accueillir un cache plus important.
Utilisation du processeur : fait référence au pourcentage d'utilisation du processeur du nœud ou du cluster. Il s'agit d'un indicateur essentiel à surveiller pour n'importe quelle base de données ou système de mise en cache. Une utilisation élevée du processeur peut signifier que votre cluster DAX est peut-être surchargé et doit être redimensionné pour faire face à la demande accrue.

Surveillez la CPUUtilization métrique de votre cluster DAX. Si l'utilisation de votre processeur approche ou dépasse régulièrement 70 à 80 %, pensez à étendre votre cluster DAX comme décrit dans la section suivante.

Si le nombre de demandes envoyées au DAX dépasse la capacité d'un nœud, le DAX limite le taux d'acceptation de demandes supplémentaires. Pour ce faire, il renvoie un ThrottlingException. DAX évalue en permanence l'utilisation du processeur de votre cluster afin de déterminer le volume de demandes qu'il peut traiter tout en maintenant un état de cluster sain.

Vous pouvez surveiller la ThrottledRequestCount métrique sur laquelle DAX publie. CloudWatch Si ces exceptions s'affichent régulièrement, vous devez envisager de mettre à l'échelle votre cluster.

Dimensionnement de votre cluster DAX à l'aide des données de surveillance

Vous pouvez déterminer si vous devez augmenter ou diminuer votre cluster DAX en surveillant ses indicateurs de performance.

Extensification ou réduction de la capacité : si votre cluster DAX utilise beaucoup le processeur, présente de faibles taux d'accès au cache (après optimisation de la stratégie de mise en cache) ou des latences de fonctionnement élevées, vous devez augmenter le volume de votre cluster. L'ajout de nœuds supplémentaires, également appelé scalage, peut aider à répartir la charge de manière plus uniforme. Pour les charges de travail impliquant une augmentation du nombre d'écritures par seconde, vous devrez peut-être choisir des nœuds plus puissants (mise à l'échelle).
Diminution : si vous constatez régulièrement une faible utilisation du processeur et des latences de fonctionnement inférieures à vos seuils, vous avez peut-être surprovisionné les ressources. Dans de tels cas, réduisez le nombre de nœuds pour réduire les coûts. Vous pouvez réduire le nombre de nœuds à 1 pendant les périodes de faible utilisation, mais vous ne pouvez pas arrêter complètement le cluster.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Opérations du cluster

Utilisation de DynamoDB avec d'autres services AWS