Recuperación de instancias
Para recuperar automáticamente una instancia, cuando ocurre un fallo de comprobación de estado del sistema, puede utilizar la configuración predeterminada de la instancia o crear una alarma de Amazon CloudWatch. Si la instancia es inaccesible debido a un error de hardware subyacente o a un problema que requiera la intervención de AWS para la reparación, puede recuperar automáticamente la instancia.
Una instancia recuperada es idéntica a la instancia original, incluido el ID de instancia, direcciones IP privadas, direcciones IP elásticas y todos los metadatos de la instancia. Si la instancia afectada tiene una dirección IPv4 pública, la conservará luego de la recuperación. Si la instancia deteriorada está en un grupo de ubicación, la instancia recuperada se ejecuta en el grupo de ubicación. Durante la recuperación de la instancia, la instancia se migró como parte de un reinicio de instancia y los datos que hay en la memoria se pierden.
Ejemplos de problemas que requieren recuperación de instancias:
-
Pérdida de conectividad de red
-
Pérdida de potencia del sistema
-
Problemas de software en el host físico
-
Problemas de hardware en el host físico que afectan a la accesibilidad a la red
Temas
Recuperación automática simplificada basada en la configuración de instancias
Las instancias que admiten la recuperación automática simplificada se configuran de forma predeterminada para recuperar una instancia fallida. La configuración predeterminada se aplica a las nuevas instancias que lanza y a las instancias existentes que lanzó anteriormente. La recuperación automática simplificada se inicia en respuesta a errores de comprobación del estado del sistema. La recuperación automática simplificada no se lleva a cabo durante los eventos de Service Health Dashboard ni ningún otro evento que afecte al hardware subyacente. Para obtener más información, consulte Solución de errores de recuperación de instancias .
Cuando falla un evento de recuperación automática simplificado, se le notifica mediante un evento de panel de AWS Health y por email. Cuando falla un evento de recuperación automática simplificado, se le notifica mediante un evento de panel de AWS Health y por email. También, puede utilizar las reglas de Amazon EventBridge para supervisar los eventos de recuperación automática simplificados mediante los siguientes códigos de evento:
-
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
: eventos exitosos -
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
: eventos fallidos
Para obtener más información, consulte Reglas de Amazon EventBridge.
Requisitos
La recuperación automática simplificada es compatible con una instancia si dichas instancias tienen las siguientes características:
-
Usa la tenencia de instancia
default
odedicated
. -
No usa un adaptador de tela elástica.
-
Usa uno de los siguientes tipos de instancias:
-
De uso general: A1 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | T1 | T2 | T3 | T3a | T4g
-
Optimizadas para computación: C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | Hpc6a |
-
Optimizadas para memoria: R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | alta memoria (u-*), solo virtualizada
-
Computación acelerada: G3 | G5g | Inf1 | P2 | P3 | VT1
-
-
Usa uno de los siguientes tipos de instancias, si no tiene volúmenes de almacenes de instancias:
-
Uso general: M3
-
Optimizada para informática: C3
-
Memoria optimizada: R3 | X1 | X1e
-
Limitaciones
-
Las instancias con volúmenes de almacenes de instancias y tipos de instancias metálicas no son compatibles con la recuperación automática simplificada.
-
Si la instancia forma parte de un grupo de Auto Scaling con comprobaciones de estado habilitadas, la instancia se reemplaza cuando deja de funcionar. La recuperación automática no se inicia para las instancias dentro de un grupo de Auto Scaling.
-
La recuperación automática simplificada se aplica únicamente a eventos no planificados. No se aplica a los eventos programados.
-
Las instancias terminadas o detenidas no se pueden recuperar.
Verificación del comportamiento de recuperación
Para ver los tipos de instancias que son compatibles con la recuperación automática simplificada, puede utilizar la AWS Management Console o la AWS CLI.
Establezca el comportamiento de recuperación
Puede establecer el comportamiento de recuperación automática en disabled
o default
después de lanzar la instancia. La configuración predeterminada no permite la recuperación automática simplificada para un tipo de instancia no compatible.
Recuperación basada en acciones de Amazon CloudWatch
Utilice la recuperación basada en acciones de Amazon CloudWatch si desea personalizar cuándo recuperar la instancia.
Cuando se activa la alarma StatusCheckFailed_System
y se inicia la acción de recuperación, se le notifica mediante el tema de Amazon SNS que seleccionó al crear la alarma y la acción de recuperación asociada. Cuando se ha completado la acción de recuperación, la información se publica en el tema de Amazon SNS que haya configurado para la alarma. Cualquier persona que esté suscrita a este tema de Amazon SNS recibirá una notificación por correo electrónico que incluya el estado del intento de recuperación e instrucciones adicionales. Como último paso de la acción de recuperación, la instancia recuperada se reinicia.
Todos los tipos de instancias admitidos por la recuperación automática simplificada también son compatibles con la recuperación basada en acciones de CloudWatch. Para obtener más información, consulte Requisitos . La recuperación basada en acciones de Amazon CloudWatch no admite instancias con volúmenes de almacenes de instancias, excepto los siguientes tipos de instancias. Si la instancia tiene volúmenes de almacenamiento de instancias adjuntos, los datos se pierden durante la recuperación.
-
Uso general: M3
-
Optimizada para informática: C3
-
Memoria optimizada: R3 | X1 | X1e | X2idn | X2iedn
La recuperación basada en acciones de Amazon CloudWatch no admite la recuperación de instancias con tenencia de hosts dedicados de Amazon EC2 e instancias metálicas.
Puede utilizar las alarmas de Amazon CloudWatch para recuperar una instancia incluso si la recuperación automática simplificada no está desactivada. Para obtener información acerca de cómo crear una alarma Amazon CloudWatch para recuperar una instancia, consulte Agregar acciones de recuperación a alarmas de Amazon CloudWatch.
Solución de errores de recuperación de instancias
Los siguientes problemas pueden hacer que la recuperación de la instancia dé error:
-
Eventos de Service Health Dashboard o eventos que afectan al bastidor subyacente. Durante estos eventos, la recuperación automática simplificada no recupera instancias. No recibirá notificaciones de error de recuperación de dichos eventos. Cualquier evento de Service Health Dashboard en curso también puede impedir que la recuperación basada en acciones de Amazon CloudWatch recupere correctamente una instancia. Consulte http://status.aws.amazon.com/
para más información sobre la disponibilidad de los servicios más recientes. -
Capacidad temporal insuficiente de hardware de sustitución.
-
La instancia tiene almacenamiento de instancia adjunto, que es una configuración no admitida en la recuperación automática de instancias.
-
La instancia ha alcanzado el límite diario máximo de tres intentos de recuperación.
El proceso de recuperación automático intenta recuperar la instancia de hasta tres errores cada día. Si el error de comprobación del estado del sistema de la instancia persiste, recomendamos que detenga e inicie manualmente la instancia. Para obtener más información, consulte Detener e iniciar la instancia .
La instancia puede ser retirada si la recuperación automática da error y se determina que una degradación de hardware es la causa del error de comprobación de estado del sistema.