Control de las instancias de Auto Scaling que se terminan durante una reducción horizontal

Amazon EC2 Auto Scaling utiliza políticas de terminación para decidir el orden de finalización de las instancias. Puede usar una política predefinida o crear una política personalizada para cumplir con sus requisitos específicos. Al usar una política personalizada o una escala de instancias en la protección, también puede evitar que su grupo de Auto Scaling cancele instancias que aún no están listas para terminar.

Contenido

Cuando Amazon EC2 Auto Scaling utiliza políticas de rescisión

En las siguientes secciones se describen los escenarios en los que Amazon EC2 Auto Scaling utiliza políticas de rescisión.

Contenido

Eventos de reducción horizontal
Actualización de instancias
Reequilibrio de la zona de disponibilidad

Eventos de reducción horizontal

Un evento de escalado ocurre cuando hay un nuevo valor para la capacidad deseada de un grupo de Auto Scaling que es inferior a la capacidad actual del grupo.

los eventos de escalamiento se producen en los siguientes escenarios:

Cuando se utilizan políticas de escalado dinámico y el tamaño del grupo disminuye como resultado de cambios en el valor de una métrica
Cuando se utiliza el escalado programado y el tamaño del grupo disminuye como resultado de una acción programada
Cuando reduce manualmente el tamaño del grupo

El siguiente ejemplo muestra cómo funcionan las políticas de rescisión cuando hay una escala de eventos.

El grupo de escalado automático de este ejemplo tiene un tipo de instancia, dos zonas de disponibilidad y una capacidad deseada de dos instancias. También tiene una política de escalado dinámico que agrega y elimina instancias cuando la utilización de recursos aumenta o disminuye. Las dos instancias de este grupo se distribuyen entre las dos zonas de disponibilidad, como se muestra en el siguiente diagrama.
Cuando el grupo Auto Scaling se amplía, Amazon EC2 Auto Scaling lanza una nueva instancia. El grupo de escalado automático ahora tiene tres instancias, distribuidas entre las dos zonas de disponibilidad, como se muestra en el siguiente diagrama.
Cuando el grupo Auto Scaling se amplía, Amazon EC2 Auto Scaling finaliza una de las instancias.
Si no asignó una política de terminación específica al grupo, Amazon EC2 Auto Scaling usa la política de terminación predeterminada. Selecciona la zona de disponibilidad con dos instancias y termina la instancia que se lanzó desde una configuración de lanzamiento, una plantilla de lanzamiento diferente o la versión más antigua de la plantilla de lanzamiento actual. Si las instancias se lanzaron desde la misma plantilla y versión de lanzamiento, Amazon EC2 Auto Scaling selecciona la instancia que está más cerca de la siguiente hora de facturación y la finaliza.

Actualización de instancias

Puede iniciar una actualización de instancias para actualizar las instancias de su grupo de Auto Scaling. Durante una actualización de instancias, Amazon EC2 Auto Scaling termina las instancias del grupo y, a continuación, lanza reemplazos para las instancias terminadas. La política de terminación del grupo de escalado automático controla qué instancias se reemplazan primero.

Reequilibrio de la zona de disponibilidad

Amazon EC2 Auto Scaling equilibra su capacidad de manera uniforme en todas las zonas de disponibilidad habilitadas para su grupo de Auto Scaling. Esto ayuda a reducir el impacto de una interrupción en la zona de disponibilidad. Si la distribución de la capacidad entre las zonas de disponibilidad se desequilibra, Amazon EC2 Auto Scaling reequilibra el grupo de Auto Scaling lanzando instancias en las zonas de disponibilidad habilitadas con el menor número de instancias y finalizando las instancias en otros lugares. La política de terminación controla qué instancias tienen prioridad para terminarlas primero.

Existen varias razones por las que la distribución de instancias entre las zonas de disponibilidad puede desequilibrarse.

Eliminación de instancias

Si desconecta instancias del grupo de escalado automático, pone instancias en espera o termina explícitamente instancias y disminuye la capacidad deseada, lo que impide que se lancen instancias de reemplazo, el grupo podría quedar desequilibrado. Si esto ocurre, Amazon EC2 Auto Scaling lo compensa reequilibrando las zonas de disponibilidad.

Uso de zonas de disponibilidad diferentes de las especificadas originalmente

Si amplía su grupo de Auto Scaling para incluir zonas de disponibilidad adicionales, o si cambia las zonas de disponibilidad que se utilizan, Amazon EC2 Auto Scaling lanza instancias en las nuevas zonas de disponibilidad y termina las instancias en otras zonas para garantizar que su grupo de Auto Scaling abarque las zonas de disponibilidad de manera uniforme.

Interrupción de disponibilidad

Las interrupciones de disponibilidad son raras. Sin embargo, si una zona de disponibilidad deja de estar disponible y se recupera posteriormente, el grupo de escalado automático puede quedar desequilibrado entre las zonas de disponibilidad. Amazon EC2 Auto Scaling intenta reequilibrar el grupo gradualmente, y el reequilibrio podría terminar con las instancias en otras zonas.

Por ejemplo, imagine que hay un grupo de escalado automático que tiene un tipo de instancia, dos zonas de disponibilidad y una capacidad deseada de dos instancias. En una situación en la que se produce un error en una zona de disponibilidad, Amazon EC2 Auto Scaling lanza automáticamente una nueva instancia en la zona de disponibilidad en buen estado para sustituir a la que se encuentra en la zona de disponibilidad en mal estado. Luego, cuando la zona de disponibilidad en mal estado vuelva a un estado correcto más adelante, Amazon EC2 Auto Scaling lanza automáticamente una nueva instancia en esta zona, la cual, a su vez, termina una instancia en la zona no afectada.

nota

Al reequilibrar, Amazon EC2 Auto Scaling lanza nuevas instancias antes de terminar las antiguas, de modo que el reequilibrio no comprometa el rendimiento o la disponibilidad de la aplicación.

Dado que Amazon EC2 Auto Scaling intenta lanzar nuevas instancias antes de cerrar las antiguas, estar en la capacidad máxima especificada o cerca de ella podría impedir o detener por completo las actividades de reequilibrio. Para evitar este problema, el sistema puede superar temporalmente la capacidad máxima especificada de un grupo con un margen del 10 % (o con un margen de una instancia, lo que sea mayor) durante una actividad de reequilibrio. El margen solo se amplía si el grupo tiene o se aproxima a la capacidad máxima y necesita reequilibrarse, ya sea por una distribución de zonas solicitada por el usuario o para compensar los problemas de disponibilidad de zona. La extensión se dura solamente mientras sea necesaria para reequilibrar el grupo, normalmente unos minutos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Consideraciones sobre las métricas personalizadas

Configure las políticas de terminación