Surveillance DAX - Amazon DynamoDB

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance DAX

Vous pouvez surveiller les indicateurs clés, tels que le taux d'accès au cache, afin de garantir des performances optimales DAX du cluster, de diagnostiquer les problèmes et de déterminer à quel moment vous devez dimensionner le cluster. La vérification régulière des indicateurs clés vous aide à maintenir les performances, la stabilité et la rentabilité en adaptant le cluster aux exigences de votre charge de travail. Pour plus d'informations sur la surveillanceDAX, consultezSurveillance en production.

La liste suivante présente certains des indicateurs clés que vous devez surveiller :

  • Taux de réussite du cache : indique l'efficacité avec laquelle les DAX données mises en cache sont traitées, réduisant ainsi le besoin d'accéder aux tables DynamoDB sous-jacentes. Quelques erreurs de cache pour le cluster indiquent une bonne efficacité de la mise en cache. Cependant, quelques accès au cache suggèrent que vous devrez peut-être revoir le TTL paramètre de mise en cache ou que la charge de travail ne convient pas à la mise en cache.

    Utilisez Amazon CloudWatch pour calculer le taux d'DAXaccès au cache de votre cluster. Comparez les QueryCacheMisses indicateurs ItemCacheHitsItemCacheMisses,QueryCacheHits, et pour obtenir ce ratio. La formule suivante indique comment le taux d'accès au cache est calculé. Pour calculer le ratio à l'aide de cette formule, divisez le nombre d'accès au cache par la somme des accès et des échecs.

    Cache hit ratio = Cache hits / (Cache hits + Cache misses)

    Le taux de réussite du cache est un nombre compris entre 0 et 1, représenté sous forme de pourcentage. Un pourcentage plus élevé indique une meilleure utilisation globale du cache.

  • ErrorRequestCount— Nombre de demandes ayant entraîné des erreurs utilisateur signalées par le nœud ou le cluster. ErrorRequestCountinclut les demandes qui ont été limitées par le nœud ou le cluster. La surveillance des erreurs des utilisateurs peut vous aider à identifier les erreurs de dimensionnement ou les modèles d'éléments ou de partitions les plus courants dans votre application.

  • Latences des opérations : la surveillance de la latence des opérations de lecture et d'écriture à destination et en provenance du DAX cluster peut vous aider à identifier les goulots d'étranglement liés aux performances. L'augmentation des latences peut indiquer des problèmes liés à la configuration de votre DAX cluster, à votre réseau ou à la nécessité d'une mise à l'échelle.

  • Consommation réseau : surveillez les NetworkBytesOut indicateurs NetworkBytesIn et les indicateurs pour surveiller le trafic réseau de votre DAX cluster. Une augmentation inattendue du débit du réseau peut entraîner une augmentation du nombre de demandes des clients ou des modèles de requêtes inefficaces entraînant le transfert d'une plus grande quantité de données.

    La surveillance de la consommation du réseau vous aide à gérer les coûts de votre DAX cluster. Cela garantit également que le réseau ne devienne pas un goulot d'étranglement pour les performances du cluster.

  • Taux d'expulsion : indique la fréquence à laquelle des objets sont retirés de votre cache pour faire de la place à de nouveaux objets. Si le taux d'éviction augmente au fil du temps, votre cache est peut-être trop petit ou votre stratégie de mise en cache n'est pas efficace.

    Surveillez la EvictedSize métrique CloudWatch pour déterminer si la taille de votre cache est adaptée à votre charge de travail. Si la taille totale expulsée ne cesse de croître, vous devrez peut-être agrandir votre DAX cluster pour qu'il puisse accueillir un cache plus important.

  • CPUutilisation — Fait référence au pourcentage d'CPUutilisation du nœud ou du cluster. Il s'agit d'un indicateur essentiel à surveiller pour n'importe quelle base de données ou système de mise en cache. Une CPU utilisation élevée peut signifier que votre DAX cluster est peut-être surchargé et qu'il doit être redimensionné pour faire face à la demande accrue.

    Surveillez la CPUUtilization métrique de votre DAX cluster. Si votre CPU taux d'utilisation approche ou dépasse régulièrement 70 à 80 %, envisagez d'étendre votre DAX cluster comme décrit dans la section suivante.

    Si le nombre de demandes envoyées DAX dépasse la capacité d'un nœud, DAX limite le taux d'acceptation de demandes supplémentaires. Pour ce faire, il renvoie un ThrottlingException. DAXévalue en permanence l'CPUutilisation de votre cluster afin de déterminer le volume de demandes qu'il peut traiter tout en maintenant un état sain du cluster.

    Vous pouvez surveiller la ThrottledRequestCount métrique DAX publiée sur CloudWatch. Si ces exceptions s'affichent régulièrement, vous devez envisager de mettre à l'échelle votre cluster.

Dimensionnement de votre DAX cluster à l'aide des données de surveillance

Vous pouvez déterminer si vous devez augmenter ou diminuer votre DAX cluster en surveillant ses indicateurs de performance.

  • Extensification ou réduction de la capacité : si le taux d'CPUutilisation de votre DAX cluster est élevé, que le nombre d'accès au cache est faible (après optimisation de la stratégie de mise en cache) ou que les latences opérationnelles sont élevées, vous devez augmenter le volume de votre cluster. L'ajout de nœuds supplémentaires, également appelé scalage, peut aider à répartir la charge de manière plus uniforme. Pour les charges de travail impliquant une augmentation du nombre d'écritures par seconde, vous devrez peut-être choisir des nœuds plus puissants (mise à l'échelle).

  • Diminution : si vous constatez régulièrement un faible CPU taux d'utilisation et des latences opérationnelles inférieures à vos seuils, vous avez peut-être surprovisionné les ressources. Dans de tels cas, réduisez le nombre de nœuds pour réduire les coûts. Vous pouvez réduire le nombre de nœuds à 1 pendant les périodes de faible utilisation, mais vous ne pouvez pas arrêter complètement le cluster.