Modelo de responsabilidad compartida para la resiliencia - Recuperación de desastres de cargas de trabajo en AWS: recuperación en la nube

Modelo de responsabilidad compartida para la resiliencia

La resiliencia es una responsabilidad compartida entre AWS y usted, el cliente. Es importante que comprenda cómo operan la recuperación de desastres y la disponibilidad, como parte de la resiliencia, en este modelo compartido.

Responsabilidad de AWS: “resiliencia de la nube”

AWS es responsable de la resiliencia de la infraestructura en la que se ejecutan todos los servicios que se ofrecen en la nube de AWS. Esta infraestructura está compuesta por hardware, software, redes e instalaciones que ejecutan servicios en la nube de AWS. AWS realiza esfuerzos comercialmente razonables para que estos servicios en la nube de AWS estén disponibles, garantizando que la disponibilidad del servicio cumpla o supere los acuerdos de nivel de servicio (SLA) de AWS.

La infraestructura en la nube global de AWS está diseñada para permitir a los clientes crear arquitecturas de carga de trabajo altamente resilientes. Cada región de AWS está completamente aislada y está compuesta por varias zonas de disponibilidad, que son particiones de infraestructura aisladas físicamente. Las zonas de disponibilidad aíslan los errores que podrían afectar a la resiliencia de las cargas de trabajo, evitando que afecten a otras zonas de la región. Pero al mismo tiempo, todas las zonas de disponibilidad de una región de AWS están interconectadas con redes de ancho de banda alto y baja latencia, a través de una fibra metropolitana exclusiva totalmente redundante que proporciona una red de alto rendimiento y baja latencia entre las zonas. Todo el tráfico entre las zonas está cifrado. El rendimiento de la red es suficiente como para llevar a cabo la replicación sincrónica entre las zonas. Las zonas de disponibilidad simplifican el proceso de dividir las aplicaciones para obtener una alta disponibilidad.

Responsabilidad del cliente: “resiliencia en la nube”

Su responsabilidad vendrá determinada por los servicios en la nube de AWS que seleccione. Esto determinará la cantidad de trabajo de configuración que debe realizar como parte de sus responsabilidades de resiliencia. Por ejemplo, un servicio como Amazon Elastic Compute Cloud (Amazon EC2) requiere que el cliente lleve a cabo todas las tareas de administración y configuración de resiliencia necesarias. Los clientes que implementan instancias de Amazon EC2 son responsables de implementar instancias de EC2 en varias ubicaciones (como las zonas de disponibilidad de AWS), implementar la reparación automática mediante servicios como AWS Auto Scaling, así como la aplicación de prácticas recomendadas de arquitectura de cargas de trabajo resilientes para las aplicaciones instaladas en las instancias. En el caso de los servicios administrados, como Amazon S3 y Amazon DynamoDB, AWS gestiona la capa de infraestructura, el sistema operativo y las plataformas, mientras que los clientes acceden a los puntos de conexión para recuperar y almacenar los datos. Usted es responsable de administrar la resiliencia de sus datos, incluidas las estrategias de copia de seguridad, control de versiones y replicación.

La implementación de la carga de trabajo en varias zonas de disponibilidad en una región de AWS forma parte de una estrategia de alta disponibilidad diseñada para proteger las cargas de trabajo aislando los problemas en una zona de disponibilidad. Aquí se utiliza la redundancia de las demás zonas de disponibilidad para seguir atendiendo solicitudes. La arquitectura Multi-AZ también forma parte de una estrategia de recuperación de desastres diseñada para que las cargas de trabajo estén mejor aisladas y protegidas de problemas como cortes de electricidad, rayos, tornados, terremotos y similares. Las estrategias de recuperación de desastres también pueden incluir usar varias regiones de AWS. Por ejemplo, en una configuración activa/pasiva, el servicio para la carga de trabajo conmutará por error desde la región activa a la región de recuperación de desastres si la región activa ya no puede atender solicitudes.

Diagrama que muestra cómo la resiliencia es una responsabilidad compartida entre AWS y el cliente.

Ilustración 2: La resiliencia es una responsabilidad compartida entre AWS y el cliente