Politiques Auto Scaling - Amazon ElastiCache for Redis

Politiques Auto Scaling

Une politique de mise à l'échelle comporte les éléments suivants :

  • Une métrique cible – La métrique CloudWatch que ElastiCache for Redis Auto Scaling utilise pour déterminer quand et combien mettre à l'échelle.

  • Capacités maximale et minimale – Le nombre minimal et maximal de partitions ou de réplicas à utiliser pour la mise à l'échelle.

    Important

    Lors de la création de la politique Auto Scaling, si la capacité actuelle est supérieure à la capacité maximale configurée, nous mettons à l'échelle MaxCapacity lors de la création de la politique. De même, si la capacité actuelle est inférieure à la capacité minimale configurée, la réduction est effectuée jusqu'à la minCapacity.

  • Un temps de stabilisation – La durée, en secondes, entre la fin d'une activité de mise à l'échelle horizontale montante ou descendante et le début d'une autre activité de mise à l'échelle horizontale.

  • Un rôle lié à un service – Un rôle AWS Identity and Access Management (IAM) lié à un service AWS spécifique. Un rôle lié à un service comprend toutes les autorisations dont le service a besoin pour appeler d'autres services AWS en votre nom. ElastiCache for Redis Auto Scaling génère automatiquement le rôle AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG pour vous.

  • Activer ou désactiver les activités de dimensionnement en charge – Capacité d'activer ou désactiver les activités de dimensionnement en charge pour une politique.

Métrique cible pour Auto Scaling

Dans ce type de politique, une métrique prédéfinie ou personnalisée et une valeur cible pour la métrique sont spécifiées dans une configuration de politique de dimensionnement Suivi de la cible. ElastiCache for Redis Auto Scaling crée et gère les alarmes CloudWatch qui déclenchent la politique de mise à l'échelle et calcule l'ajustement de mise à l'échelle en fonction de la métrique et de la valeur cible. La politique de mise à l'échelle ajoute ou supprime des partitions/réplicas si nécessaire pour maintenir la métrique à la valeur cible spécifiée ou proche de celle-ci. En plus de maintenir la métrique proche de la valeur cible, une politique de dimensionnement Suivi de la cible s'ajuste également aux fluctuations de la métrique dues à l'évolution de la charge de travail. Une politique de ce type minimise également les fluctuations rapides dans le nombre de partitions/réplicas disponibles pour votre cluster.

Par exemple, examinons une politique de mise à l'échelle qui utilise la métrique prédéfinie d'utilisation moyenne de ElastiCachePrimaryEngineCPUUtilization. Ce type de politique peut maintenir l'utilisation du CPU au pourcentage d'utilisation indiqué, tel que 70 %, ou proche de celui-ci.

Note

Pour chaque cluster, vous ne pouvez créer qu'une seule politique Auto Scaling pour chaque métrique cible.

Une capacité maximale et minimale

Partitions

Vous pouvez spécifier le nombre maximal de partitions qui peuvent être mise à l'échelle par la scalabilité automatique ElastiCache for Redis. Cette valeur doit être comprise entre 1 et 250, inclus. Vous pouvez spécifier le nombre maximal de partitions qui peuvent être gérées par la scalabilité automatique ElastiCache for Redis. Cette valeur doit être au moins égale à 1, et égale ou inférieure à la valeur spécifiée pour le maximum de partitions, soit 250.

Réplicas

Vous pouvez spécifier le nombre maximal de réplicas qui peuvent être gérés par la scalabilité automatique ElastiCache for Redis. Cette valeur doit être inférieure ou égale à 5. Vous pouvez spécifier le nombre maximal de réplicas qui peuvent être gérés par la scalabilité automatique ElastiCache for Redis. Cette valeur doit être au moins égale à 1, et égale ou inférieure à la valeur spécifiée pour le maximum de réplicas, soit 5.

Pour déterminer le nombre minimal et le nombre maximal de partitions/réplicas dont vous avez besoin pour un trafic classique, testez votre configuration de Auto Scaling avec le débit attendu de trafic pour votre modèle.

Note

Les politiques de scalabilité automatique ElastiCache for Redis augmentent la capacité du cluster jusqu'à ce qu'il atteigne la taille maximale définie ou jusqu'à ce que des limites de service s'appliquent. Pour demander une augmentation de cette limite, veuillez consulter AWS Service Limits et sélectionnez le type de limite Nœuds par cluster par type d'instance.

Important

Dimensionnement en l'absence de trafic. Si le trafic d'une variante devient égal à zéro, ElastiCache for Redis est automatiquement réduit au nombre minimal d'instances spécifié.

Temps de stabilisation

Vous pouvez affiner la réactivité d'une politique de suivi de cible et d'échelonnement en ajoutant des temps de stabilisation qui affectent le dimensionnement de votre cluster. Un temps de stabilisation bloque les demandes de montée ou de diminution en charge ultérieures jusqu'à l'expiration de la période. Cela ralentit les suppressions de partitions ou réplicas dans votre cluster ElastiCache for Redis pour les demandes de réduction, et la création de partitions ou réplicas pour les demandes de montée en puissance. Vous pouvez spécifier les temps de stabilisation suivants :

  • Une activité de diminution de charge réduit le nombre de réplicas/partitions dans votre cluster ElastiCache for Redis. Un temps de stabilisation de diminution en charge spécifie la durée, en secondes, devant s'écouler entre la fin d'une activité de diminution et le début d'une autre.

  • Une activité de montée en charge augmente le nombre de réplicas/partitions dans votre cluster ElastiCache for Redis. Un temps de stabilisation de montée en charge spécifie la durée, en secondes, devant s'écouler entre la fin d'une activité de montée en charge et le début d'une autre.

Lorsqu'aucun temps de stabilisation de diminution ou de montée en charge n'est pas spécifié, la valeur par défaut est 600 secondes pour l'augmentation et de 900 secondes pour la diminution.

Activation ou désactivation d'activités de diminution en charge

Vous pouvez activer ou désactiver des activités de diminution en charge pour une politique. L'activation d'activités de diminution de charge permet à la politique de mise à l'échelle de supprimer des partitions/réplicas. Lorsque des activités de diminution en charge sont activées, le temps de stabilisation de diminution en charge figurant dans la politique de dimensionnement leur est appliqué. La désactivation d'activités de diminution de charge empêche la politique de mise à l'échelle de supprimer des partitions/réplicas.

Note

Les activités de montée en charge sont toujours activées de sorte que la politique de mise à l'échelle puisse créer des partitions/réplicas ElastiCache for Redis si nécessaire.