REL10-BP03 Automatice la recuperación de componentes restringidos a una sola ubicación - Pilar de fiabilidad

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

REL10-BP03 Automatice la recuperación de componentes restringidos a una sola ubicación

Si los componentes de la carga de trabajo solo se pueden ejecutar en una zona de disponibilidad o en el centro de datos en las instalaciones, implemente la capacidad de volver a crear la carga de trabajo de acuerdo con los objetivos de recuperación definidos.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

Si la práctica recomendada de implementar la carga de trabajo en varias ubicaciones no es posible por limitaciones tecnológicas, debe implementar una ruta alternativa hacia la resiliencia. Debe automatizar la capacidad de recrear la infraestructura necesaria, volver a implementar las aplicaciones y volver a crear los datos necesarios para estos casos.

Por ejemplo, Amazon EMR lanza todos los nodos de un clúster determinado en la misma zona de disponibilidad porque ejecutar un clúster en la misma zona mejora el rendimiento de los flujos de trabajo, ya que proporciona una mayor tasa de acceso a los datos. Si este componente resulta necesario para la resiliencia de la carga de trabajo, debe tener una forma de volver a implementar el clúster y sus datos. Además, en el caso de AmazonEMR, deberías aprovisionar la redundancia de formas distintas al uso de Multi-AZ. Puede aprovisionar varios nodos. Con EMRFile System (EMRFS), los datos se EMR pueden almacenar en Amazon S3, que a su vez se puede replicar en varias zonas de disponibilidad o Regiones de AWS.

Del mismo modo, en el caso de Amazon Redshift, aprovisiona el clúster de forma predeterminada en una zona de disponibilidad seleccionada al azar dentro de la Región de AWS que usted seleccione. Todos los nodos del clúster se aprovisionan en la misma zona.

En el caso de las cargas de trabajo con estado y basadas en servidores que se despliegan en un centro de datos local, puede utilizarlas AWS Elastic Disaster Recovery para proteger sus cargas de trabajo en ellas. AWS Si ya está alojado en él AWS, puede usar Elastic Disaster Recovery para proteger su carga de trabajo en una zona o región de disponibilidad alternativa. La Recuperación de desastres elástica utiliza la replicación continua en el nivel de bloque en un espacio de almacenamiento ligero para proporcionar una recuperación rápida y fiable de las aplicaciones en las instalaciones y basadas en la nube.

Pasos para la implementación

  1. Implemente la autorrecuperación. Implemente sus instancias o contenedores con escalado automático siempre que sea posible. Si no puedes usar el escalado automático, usa la recuperación automática para EC2 las instancias o implementa una automatización de autorreparación basada en los eventos del ciclo de vida de Amazon EC2 o de los ECS contenedores.

    • Utilice los grupos de Amazon EC2 Auto Scaling para instancias y cargas de trabajo de contenedores que no requieran una dirección IP de instancia única, una dirección IP privada, una dirección IP elástica y metadatos de instancia.

      • Los datos de usuario de la plantilla de lanzamiento se pueden usar para implementar una automatización que pueda solucionar la mayoría de las cargas de trabajo.

    • Utilice la recuperación automática de EC2 instancias de Amazon para cargas de trabajo que requieran una única dirección de ID de instancia, una dirección IP privada, una dirección IP elástica y metadatos de instancia.

      • La recuperación automática enviará alertas del estado de la recuperación a un SNS tema a medida que se detecte el error de la instancia.

    • Utilice los eventos del ciclo de vida de las EC2 instancias de Amazon o ECS los eventos de Amazon para automatizar la autorreparación cuando no se pueda utilizar el escalado o la EC2 recuperación automáticos.

      • Utilice los eventos para invocar la automatización que reparará su componente de acuerdo con la lógica de proceso que necesita.

    • Proteja las cargas de trabajo con estado que están limitadas a una única ubicación con AWS Elastic Disaster Recovery.

Recursos

Documentos relacionados: