Policy di Auto Scaling - Amazon ElastiCache (RedisOSS)

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Policy di Auto Scaling

Una policy di dimensionamento dispone dei seguenti componenti:

  • Una metrica di destinazione: la CloudWatch metrica utilizzata da ElastiCache (Redis OSS) Auto Scaling per determinare quando e quanto scalare.

  • Capacità minima e massima: il numero minimo e massimo di shard o repliche da utilizzare per il dimensionamento.

    Importante

    Durante la creazione della politica di Auto Scaling, se la capacità corrente è superiore alla capacità massima configurata, eseguiamo lo ScaleIn durante la creazione della policy. MaxCapacity Allo stesso modo, se la capacità attuale è inferiore alla capacità minima configurata, scaleOut viene impostato su. MinCapacity

  • Un tempo di raffreddamento: la quantità di tempo, in secondi, dopo il completamento di un'attività per ridurre orizzontalmente o aumentare orizzontalmente prima che un'altra attività per aumentare orizzontalmente si possa avviare.

  • Un ruolo collegato al servizio: un ruolo di AWS Identity and Access Management (IAM) collegato a un servizio specifico. AWS Un ruolo collegato al servizio include tutte le autorizzazioni richieste dal servizio per chiamare altri AWS servizi per tuo conto. ElastiCache (Redis OSS) Auto Scaling genera automaticamente questo ruolo AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG per te.

  • Attiva o disabilita le attività di riduzione orizzontale: capacità di abilitare o disabilitare le attività di riduzione orizzontale per una policy.

Parametro di destinazione per Auto Scaling

In questo tipo di policy, una metrica predefinita o personalizzata e un valore target per la metrica vengono specificati in una configurazione della policy di target-tracking scaling. ElastiCache (Redis OSS) Auto Scaling crea e CloudWatch gestisce allarmi che attivano la politica di scalabilità e calcola la regolazione della scalabilità in base alla metrica e al valore target. La policy di dimensionamento aggiunge o rimuove le shard/repliche come richiesto per mantenere il parametro al valore di destinazione specificato o vicino a esso. Oltre a mantenere il parametro vicino al valore di destinazione, una policy di dimensionamento con monitoraggio degli obiettivi si adatta anche alle oscillazioni del parametro dovute a un carico di lavoro mutevole. Tale policy riduce anche le fluttuazioni rapide nel numero di shard/repliche disponibili per il cluster.

Ad esempio, prendi una policy di dimensionamento che usa il parametro medio di default ElastiCachePrimaryEngineCPUUtilization. Tale policy può mantenere l'utilizzo della CPU a una percentuale specifica di utilizzo, come il 70 percento, o vicino ad essa.

Nota

Per ogni cluster , è possibile creare solo una policy di Auto Scaling per ogni parametro di destinazione.

Capacità minima e massima

Shard

È possibile specificare il numero massimo di shard a cui è possibile scalare mediante la scalatura automatica ElastiCache (Redis OSS). Questo valore deve essere uguale o inferiore a 250 con un minimo di 1. È inoltre possibile specificare il numero minimo di shard da gestire mediante la scalabilità automatica ElastiCache (Redis OSS). Questo valore deve essere almeno 1 e o uguale o minore del valore specificato per il numero massimo di 250 shard.

Repliche

È possibile specificare il numero massimo di repliche da gestire mediante la scalabilità automatica ElastiCache (Redis OSS). Questo valore deve essere maggiore o uguale a 5. È inoltre possibile specificare il numero minimo di repliche da gestire mediante la scalabilità automatica ElastiCache (Redis OSS). Questo valore deve essere almeno 1 e o uguale o inferiore del valore 5 specificato per il numero massimo repliche.

Per determinare il numero minimo e massimo di shard/repliche necessarie per il traffico tipico, esegui il test della configurazione di Auto Scaling con il tasso di traffico previsto per il modello.

Nota

ElastiCache Le politiche di scalabilità automatica (Redis OSS) aumentano la capacità del cluster fino a raggiungere la dimensione massima definita o fino all'applicazione dei limiti di servizio. Per richiedere un aumento dei limiti, consulta AWS Limiti del servizio e seleziona il tipo di limite Nodi per cluster per tipo di istanza.

Importante

Ridurre orizzontalmente in assenza di traffico Se il traffico di una variante diventa zero, ElastiCache (Redis OSS) si ridimensiona automaticamente fino al numero minimo di istanze specificato.

Periodo di raffreddamento

È possibile sintonizzare i tempi di risposta di una policy di dimensionamento con monitoraggio degli obiettivi aggiungendo dei tempi di raffreddamento che influiscano sul dimensionamento del cluster. Un periodo di attesa blocca le richieste di riduzione o aumento ulteriori finché il periodo non scade. Ciò rallenta l'eliminazione di frammenti/repliche nel cluster ElastiCache (Redis OSS) per le richieste di scalabilità orizzontale e la creazione di frammenti/repliche per le richieste di scalabilità orizzontale. Puoi specificare i seguenti periodi di attesa:

  • Un'attività di scalabilità riduce il numero di shard/repliche nel cluster (Redis OSS). ElastiCache Un periodo di attesa di riduzione specifica la quantità di tempo che deve passare, in secondi, tra il completamento di un'attività di riduzione e l'inizio di un'altra attività di questo tipo.

  • Un'attività di scalabilità orizzontale aumenta il numero di shard/repliche nel cluster (Redis OSS). ElastiCache Un periodo di attesa di aumento specifica la quantità di tempo che deve passare, in secondi, tra il completamento di un'attività di aumento e l'inizio di un'altra attività di questo tipo.

Quando un periodo di raffreddamento di riduzione orizzontale o di aumento orizzontale non viene specificato, il valore di default per ogni aumento orizzontale è pari a 600 secondi e 900 per ogni riduzione orizzontale.

Abilitazione o disabilitazione delle attività di riduzione

Puoi abilitare o disabilitare le attività di riduzione per una policy. Abilitare queste attività di riduzione orizzontale consente alla policy di dimensionamento di eliminare le repliche /shard. Quando le attività di riduzione sono abilitate, il periodo di attesa della riduzione nella policy di dimensionamento si applica alle attività di riduzione. Disabilitare le attività di riduzione orizzontale evita alla policy di dimensionamento di eliminare le repliche /shard.

Nota

Le attività di scalabilità orizzontale sono sempre abilitate in modo che la politica di scalabilità possa creare shard/repliche (Redis OSS) in base alle esigenze. ElastiCache