Recuperación de instancias - Amazon Elastic Compute Cloud

Recuperación de instancias

Para recuperar automáticamente una instancia, cuando ocurre un fallo de comprobación de estado del sistema, puede utilizar la configuración predeterminada de la instancia o crear una alarma de Amazon CloudWatch. Si la instancia es inaccesible debido a un error de hardware subyacente o a un problema que requiera la intervención de AWS para la reparación, puede recuperar automáticamente la instancia.

Una instancia recuperada es idéntica a la instancia original, incluido el ID de instancia, direcciones IP privadas, direcciones IP elásticas y todos los metadatos de la instancia. Si la instancia afectada tiene una dirección IPv4 pública, la conservará luego de la recuperación. Si la instancia deteriorada está en un grupo de ubicación, la instancia recuperada se ejecuta en el grupo de ubicación. Durante la recuperación de la instancia, la instancia se migró como parte de un reinicio de instancia y los datos que hay en la memoria se pierden.

Ejemplos de problemas que requieren recuperación de instancias:

  • Pérdida de conectividad de red

  • Pérdida de potencia del sistema

  • Problemas de software en el host físico

  • Problemas de hardware en el host físico que afectan a la accesibilidad a la red

Recuperación automática simplificada basada en la configuración de instancias

Las instancias que admiten la recuperación automática simplificada se configuran de forma predeterminada para recuperar una instancia fallida. La configuración predeterminada se aplica a las nuevas instancias que lanza y a las instancias existentes que lanzó anteriormente. La recuperación automática simplificada se inicia en respuesta a errores de comprobación del estado del sistema. La recuperación automática simplificada no se lleva a cabo durante los eventos de Service Health Dashboard ni ningún otro evento que afecte al hardware subyacente. Para obtener más información, consulte Solución de errores de recuperación de instancias .

Cuando falla un evento de recuperación automática simplificado, se le notifica mediante un evento de panel de AWS Health y por email. Cuando falla un evento de recuperación automática simplificado, se le notifica mediante un evento de panel de AWS Health y por email. También, puede utilizar las reglas de Amazon EventBridge para supervisar los eventos de recuperación automática simplificados mediante los siguientes códigos de evento:

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS: eventos exitosos

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE: eventos fallidos

Para obtener más información, consulte Reglas de Amazon EventBridge.

Requisitos

La recuperación automática simplificada es compatible con una instancia si dichas instancias tienen las siguientes características:

  • Usa la tenencia de instancia default o dedicated.

  • No usa un adaptador de tela elástica.

  • Usa uno de los siguientes tipos de instancias:

    • De uso general: A1 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | T1 | T2 | T3 | T3a | T4g

    • Optimizadas para computación: C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | Hpc6a |

    • Optimizadas para memoria: R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | alta memoria (u-*), solo virtualizada

    • Computación acelerada: G3 | G5g | Inf1 | P2 | P3 | VT1

  • Usa uno de los siguientes tipos de instancias, si no tiene volúmenes de almacenes de instancias:

    • Uso general: M3

    • Optimizada para informática: C3

    • Memoria optimizada: R3 | X1 | X1e

Limitaciones

  • Las instancias con volúmenes de almacenes de instancias y tipos de instancias metálicas no son compatibles con la recuperación automática simplificada.

  • Si la instancia forma parte de un grupo de Auto Scaling con comprobaciones de estado habilitadas, la instancia se reemplaza cuando deja de funcionar. La recuperación automática no se inicia para las instancias dentro de un grupo de Auto Scaling.

  • La recuperación automática simplificada se aplica únicamente a eventos no planificados. No se aplica a los eventos programados.

  • Las instancias terminadas o detenidas no se pueden recuperar.

Verificación del comportamiento de recuperación

Para ver los tipos de instancias que son compatibles con la recuperación automática simplificada, puede utilizar la AWS Management Console o la AWS CLI.

Console

Para ver los tipos de instancias que son compatibles con la recuperación automática simplificada

  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación izquierdo, elija Instance Types (Tipos de instancias).

  3. En la barra de filtros, ingrese Auto Recovery support: true (Compatibilidad con la recuperación automática: verdadero). Como alternativa, a medida que ingrese los caracteres y aparezca el nombre del filtro, podrá seleccionarlo.

    La tabla de Instance types (Tipos de Instancia) muestra todos los tipos de instancia que son compatibles con la recuperación automática simplificada.

AWS CLI

Para ver los tipos de instancias que son compatibles con la recuperación automática simplificada

Utilice el comando describe-instance-types.

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

Establezca el comportamiento de recuperación

Puede establecer el comportamiento de recuperación automática en disabled o default después de lanzar la instancia. La configuración predeterminada no permite la recuperación automática simplificada para un tipo de instancia no compatible.

Console

Para desactivar la recuperación automática simplificada durante la instancia de lanzamiento

  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación, elija Instances (Instancias) y elija Launch Instances (Lanzar instancias).

  3. En la sección Advanced details (Detalles avanzados), en Instance auto-recovery (Recuperación automática de instancias), seleccione Disabled (Desactivado).

  4. Configure los ajustes de lanzamiento de instancias restantes según sea necesario y luego lance la instancia.

Para deshabilitar la recuperación automática simplificada para una instancia en ejecución o detenida

  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación, seleccione Instances (Instancias).

  3. Seleccione la instancia y, a continuación, elija Actions (Acciones), Instance Settings (Configuración de la instancia), Change auto-recovery behavior (Cambiar comportamiento de recuperación automática).

  4. Elija Off (Apagado) y, a continuación, elija Save (Guardar).

Para establecer el comportamiento de recuperación automática como default para una instancia en ejecución o detenida

  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación, seleccione Instances (Instancias).

  3. Seleccione la instancia y, a continuación, elija Actions (Acciones), Instance Settings (Configuración de la instancia), Change auto-recovery behavior (Cambiar comportamiento de recuperación automática).

  4. Elija Default (Predeterminado) y, a continuación, elija Save (Guardar).

AWS CLI

Para deshabilitar la recuperación automática simplificada durante el lanzamiento

Utilice el comando run-instances.

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]

Para deshabilitar la recuperación automática simplificada para una instancia en ejecución o detenida

Utilice el comando modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled

Para establecer el comportamiento de recuperación automática como default para una instancia en ejecución o detenida

Utilice el comando modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

Recuperación basada en acciones de Amazon CloudWatch

Utilice la recuperación basada en acciones de Amazon CloudWatch si desea personalizar cuándo recuperar la instancia.

Cuando se activa la alarma StatusCheckFailed_System y se inicia la acción de recuperación, se le notifica mediante el tema de Amazon SNS que seleccionó al crear la alarma y la acción de recuperación asociada. Cuando se ha completado la acción de recuperación, la información se publica en el tema de Amazon SNS que haya configurado para la alarma. Cualquier persona que esté suscrita a este tema de Amazon SNS recibirá una notificación por correo electrónico que incluya el estado del intento de recuperación e instrucciones adicionales. Como último paso de la acción de recuperación, la instancia recuperada se reinicia.

Todos los tipos de instancias admitidos por la recuperación automática simplificada también son compatibles con la recuperación basada en acciones de CloudWatch. Para obtener más información, consulte Requisitos . La recuperación basada en acciones de Amazon CloudWatch no admite instancias con volúmenes de almacenes de instancias, excepto los siguientes tipos de instancias. Si la instancia tiene volúmenes de almacenamiento de instancias adjuntos, los datos se pierden durante la recuperación.

  • Uso general: M3

  • Optimizada para informática: C3

  • Memoria optimizada: R3 | X1 | X1e | X2idn | X2iedn

La recuperación basada en acciones de Amazon CloudWatch no admite la recuperación de instancias con tenencia de hosts dedicados de Amazon EC2 e instancias metálicas.

Puede utilizar las alarmas de Amazon CloudWatch para recuperar una instancia incluso si la recuperación automática simplificada no está desactivada. Para obtener información acerca de cómo crear una alarma Amazon CloudWatch para recuperar una instancia, consulte Agregar acciones de recuperación a alarmas de Amazon CloudWatch.

Solución de errores de recuperación de instancias

Los siguientes problemas pueden hacer que la recuperación de la instancia dé error:

  • Eventos de Service Health Dashboard o eventos que afectan al bastidor subyacente. Durante estos eventos, la recuperación automática simplificada no recupera instancias. No recibirá notificaciones de error de recuperación de dichos eventos. Cualquier evento de Service Health Dashboard en curso también puede impedir que la recuperación basada en acciones de Amazon CloudWatch recupere correctamente una instancia. Consulte http://status.aws.amazon.com/ para más información sobre la disponibilidad de los servicios más recientes.

  • Capacidad temporal insuficiente de hardware de sustitución.

  • La instancia tiene almacenamiento de instancia adjunto, que es una configuración no admitida en la recuperación automática de instancias.

  • La instancia ha alcanzado el límite diario máximo de tres intentos de recuperación.

El proceso de recuperación automático intenta recuperar la instancia de hasta tres errores cada día. Si el error de comprobación del estado del sistema de la instancia persiste, recomendamos que detenga e inicie manualmente la instancia. Para obtener más información, consulte Detener e iniciar la instancia .

La instancia puede ser retirada si la recuperación automática da error y se determina que una degradación de hardware es la causa del error de comprobación de estado del sistema.