Diseñar su carga de trabajo para que soporte los errores de los componentes
Las cargas de trabajo con un requisito de alta disponibilidad y un tiempo de recuperación (MTTR) bajo deben diseñarse para que sean resilientes.
Prácticas recomendadas
- REL11-BP01 Supervisar todos los componentes de la carga de trabajo para detectar errores
- REL11-BP02 Conmutación por error a recursos en buen estado
- REL11-BP03 Automatizar la reparación en todas las capas
- REL11-BP04 Confiar en el plano de datos y no en el plano de control durante la recuperación
- REL11-BP05 Usar la estabilidad estática para evitar el comportamiento bimodal
- REL11-BP06 Enviar notificaciones cuando los eventos afecten a la disponibilidad
- REL11-BP07 Diseñar su producto para cumplir objetivos de disponibilidad y acuerdos de nivel de servicio (SLA) de tiempo de actividad