Principios de diseño - AWS Well-Architected Framework

Principios de diseño

Existen cinco principios de diseño de fiabilidad en la nube:

  • Recuperación automática de errores: al supervisar una carga de trabajo para los indicadores clave de rendimiento (KPI), puede desencadenar la automatización cuando se supere un umbral. Estos KPI deben ser una medida del valor de negocio, no de los aspectos técnicos del funcionamiento del servicio. De este modo, se permite la notificación y el seguimiento automático de los errores, así como los procesos de recuperación automatizada que pueden solucionar o corregir el error. Con una automatización más sofisticada, es posible anticipar y solucionar errores antes de que sucedan.

  • Prueba de los procedimientos de recuperación: en un entorno local, a menudo se realizan pruebas para ver si una carga de trabajo funciona en una situación concreta. Normalmente, las pruebas no se usan para comprobar estrategias de recuperación. En la nube, puede probar los errores de la carga de trabajo y validar los procedimientos de recuperación. Puede usar la automatización para simular diferentes errores o recrear escenarios que anteriormente han producido algún error. Esto expone vías de error que puede probar y arreglar antes de que se produzca un escenario de error real, lo que reduce el riesgo.

  • Escalar horizontalmente para aumentar la disponibilidad de la carga de trabajo de agregación:reemplace un recurso grande por varios recursos pequeños para reducir el efecto de un solo error en todo la carga de trabajo. Distribuya las solicitudes a través de varios recursos más pequeños para garantizar que no compartan el mismo error.

  • No más conjeturas sobre la capacidad: una causa común de los errores en los sistemas locales es la saturación de recursos, cuando las demandas que se le asignan a una carga de trabajo superan su capacidad (este es a menudo el objetivo de los ataques de denegación de servicio). En la nube, se puede supervisar la demanda y el uso de la carga de trabajo, además de automatizar la incorporación o eliminación de recursos de forma automatizada para mantener un nivel óptimo y satisfacer la demanda sin tener un aprovisionamiento excesivo o insuficiente. Aún hay límites, pero algunas cuotas se pueden controlar, mientras que otras se pueden administrar (consulte Administración de Service Quotas y restricciones).

  • Administración de cambios en la automatización: los cambios que se apliquen a la infraestructura deben realizarse con automatización. Entre los cambios que se deben administrar se encuentran los de la automatización, de los que, posteriormente, se puede hacer un seguimiento y una revisión.