Disponibilidad y más allá: Descripción y mejora de la resiliencia de los sistemas distribuidos en AWS - Disponibilidad y más allá: Descripción y mejora de la resiliencia de los sistemas distribuidos en AWS

Disponibilidad y más allá: Descripción y mejora de la resiliencia de los sistemas distribuidos en AWS

Fecha de publicación: 12 de noviembre de 2021 (Historial de documentos)

En la actualidad, las empresas utilizan sistemas complejos y distribuidos tanto en la nube como en las instalaciones. Quieren que estas cargas de trabajo sean resilientes para poder atender a sus clientes y cumplir sus objetivos empresariales. Este documento describe comúnmente la disponibilidad como medida de la resiliencia, define reglas para crear cargas de trabajo de alta disponibilidad y ofrece orientación sobre cómo mejorar la disponibilidad de las cargas de trabajo.

Introducción

¿Qué significa crear una carga de trabajo de alta disponibilidad? ¿Cómo se mide la disponibilidad? ¿Qué puedo hacer para aumentar la disponibilidad de mi carga de trabajo? Este documento le ayudará a responder a este tipo de preguntas. Está dividido en tres secciones principales. La primera sección, Descripción de la disponibilidad, es en gran parte teórica. Establece una definición común para la disponibilidad y los factores que la afectan. La segunda sección, Cómo medir la disponibilidad, proporciona orientación sobre cómo medir empíricamente la disponibilidad de una carga de trabajo. La tercera sección, Cómo diseñar sistemas distribuidos de alta disponibilidad en AWS, es una aplicación práctica de las ideas presentadas en la primera sección. Además, a lo largo de estas secciones, este documento identificará las reglas para crear cargas de trabajo resilientes. El objetivo de este documento es respaldar la orientación y las prácticas recomendadas presentadas en el Pilar de fiabilidad del marco AWS Well-Architected Framework.

A lo largo de todo el contenido del documento, encontrarás muchas expresiones matemáticas algebraicas. Las conclusiones clave son los conceptos que respaldan estas matemáticas, no las matemáticas en sí mismas. Dicho esto, presentar un desafío también es la intención de este documento. Cuando se utilizan cargas de trabajo de alta disponibilidad, es necesario poder demostrar matemáticamente que lo que se ha creado está consiguiendo su objetivo. Es posible que incluso los mejores diseños basados en buenas intenciones no logren el resultado deseado de manera coherente. Esto significa que se necesitan mecanismos que midan la eficacia de la solución y, por lo tanto, se necesita cierto nivel de matemáticas para crear y operar sistemas distribuidos resilientes y de alta disponibilidad.