As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Monitoramento e observabilidade do AWS Incident Detection and Response
O AWS Incident Detection and Response oferece orientação especializada sobre como definir a observabilidade em suas cargas de trabalho, desde a camada de aplicação até a infraestrutura subjacente. O monitoramento indica que algo está errado. A observabilidade usa a coleta de dados para dizer o que está errado e por que isso aconteceu.
O sistema de detecção e resposta a incidentes monitora suas AWS cargas de trabalho em busca de falhas e degradação do desempenho, aproveitando AWS serviços nativos, como Amazon e CloudWatch Amazon, EventBridge para detectar eventos que possam afetar sua carga de trabalho. O monitoramento fornece notificações de falhas iminentes, contínuas, recorrentes ou potenciais ou de degradação do desempenho. Ao integrar sua conta à Detecção e Resposta a Incidentes, você seleciona quais alarmes em sua conta devem ser monitorados pelo sistema de monitoramento de Detecção e Resposta a Incidentes e associa esses alarmes a um aplicativo e a um runbook usados durante o gerenciamento de incidentes.
A Detecção e Resposta a Incidentes usa a Amazon CloudWatch e outras empresas Serviços da AWS para criar sua solução de observabilidade. O AWS Incident Detection and Response ajuda você com a observabilidade de duas maneiras:
Métricas de resultados comerciais: a observabilidade na detecção e resposta de incidentes da AWS começa com a definição das principais métricas que monitoram os resultados de suas cargas de trabalho ou da experiência do usuário final. AWS os especialistas trabalham com você para entender os objetivos de sua carga de trabalho, os principais resultados ou fatores que podem afetar a experiência do usuário e para definir as métricas e alertas que capturam qualquer degradação nessas métricas principais. Por exemplo, uma métrica comercial importante para um aplicativo de chamadas móveis é a taxa de sucesso da configuração de chamadas (monitora a taxa de sucesso das tentativas de chamadas do usuário), e uma métrica importante para um site é a velocidade da página. O engajamento de incidentes é acionado com base nas métricas de resultados comerciais.
Métricas de nível de infraestrutura: nesse estágio, identificamos a base Serviços da AWS e a infraestrutura que suporta seu aplicativo e definimos métricas e alarmes para monitorar o desempenho desses serviços de infraestrutura. Isso pode incluir métricas como
ApplicationLoadBalancerErrorCount
para instâncias do Application Load Balancer. Isso começa depois que a carga de trabalho é integrada e o monitoramento é configurado.
Implementando a observabilidade na detecção e resposta a incidentes da AWS
Como a observabilidade é um processo contínuo que pode não ser concluído em um exercício ou período de tempo, o AWS Incident Detection and Response implementa a observabilidade em duas fases:
Fase de integração: a observabilidade durante a integração se concentra em detectar quando os resultados comerciais do seu aplicativo estão prejudicados. Para esse fim, a observabilidade durante a fase de integração se concentra na definição das principais métricas de resultados de negócios na camada de aplicativos para notificar interrupções em suas cargas AWS de trabalho. Dessa forma, AWS pode responder prontamente a essas interrupções e fornecer ajuda na recuperação.
Fase de pós-integração: o AWS Incident Detection and Response oferece vários serviços proativos de observabilidade, incluindo a definição de métricas no nível da infraestrutura, o ajuste de métricas e a configuração de rastreamentos e registros, dependendo do nível de maturidade do cliente. A implementação desses serviços pode durar vários meses e envolver várias equipes. O AWS Incident Detection and Response fornece orientação sobre a configuração da observabilidade e os clientes devem implementar as mudanças necessárias em seu ambiente de carga de trabalho. Para obter ajuda com a implementação prática de recursos de observabilidade, faça uma solicitação aos seus gerentes técnicos de contas (). TAMs