Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Etapa 4: Operar
Esta etapa se centra en las prácticas operativas que utiliza su sistema para mantener y mejorar la resiliencia. Crear una cultura de excelencia operativa ayuda a establecer estándares y coherencia para estas prácticas.
Observabilidad
Para medir la resiliencia de forma eficaz, supervise sus aplicaciones tanto desde el lado del servidor como desde el lado del cliente.
Para la supervisión del lado del servidor, utilice las herramientas de supervisión de la infraestructura que prefiera. Con estas herramientas, configure paneles, alarmas y notificaciones para detectar cualquier infracción de los indicadores clave de rendimiento (KPIs) de la infraestructura o las aplicaciones. Si utilizas Amazon CloudWatch, configura cuadros de mando y alarmas para que envíen alertas sobre cualquier fallo en la infraestructura o en las aplicaciones.
Use Service Quotas, Servicio de AWS que le ayuda a administrar sus cuotas para muchos Servicios de AWS. Esto ayuda a evitar problemas con las cuotas de servicio a la hora de ampliar las cargas de trabajo de producción. AWS También puede crear CloudWatch alarmas que le avisen cuando se acerque al límite para los servicios críticos de su carga de trabajo.
Para la supervisión del lado del cliente, configure la supervisión sintética mediante la creación de scripts o canarios que supervisen la aplicación en busca de métricas, como la disponibilidad, los tiempos de carga de las páginas o los enlaces rotos. La monitorización sintética verifica continuamente la experiencia de sus clientes siguiendo las mismas rutas y acciones que los clientes. Puede utilizar Amazon CloudWatch Synthetics Canaries para supervisar visualmente sus aplicaciones. El modelo de monitoreo visual le ayuda a crear o actualizar rápidamente archivos canarios que comparan las capturas de pantalla de la aplicación en ejecución con las capturas de pantalla de referencia. También puedes usar CloudWatch RUM para monitorizar a los usuarios reales con el fin de recopilar y ver datos del lado del cliente sobre el rendimiento de tu aplicación web a partir de sesiones de usuarios reales prácticamente en tiempo real. Puede visualizar y analizar datos, como los tiempos de carga de la página, los errores del lado del cliente y el comportamiento de los usuarios.
Recursos adicionales:
Resiliencia continua
Revise periódicamente la postura de resiliencia de sus cargas de trabajo de misión crítica mediante el AWS Well-Architected Tool. Considere también la posibilidad de organizar un día de juego