OPS08-BP04 Crea avvisi utilizzabili - AWS Well-Architected Framework

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

OPS08-BP04 Crea avvisi utilizzabili

Rilevare e rispondere tempestivamente alle deviazioni di comportamento dell'applicazione è fondamentale. Particolarmente importante è riconoscere quando i risultati basati sugli indicatori chiave di prestazione (KPIs) sono a rischio o quando si verificano anomalie impreviste. La base degli avvisi KPIs garantisce che i segnali ricevuti siano direttamente collegati all'impatto aziendale o operativo. Questo approccio verso avvisi fruibili promuove risposte proattive e aiuta a mantenere le prestazioni e l'affidabilità del sistema.

Risultato desiderato: ricevi avvisi tempestivi, pertinenti e utilizzabili per identificare e mitigare rapidamente i potenziali problemi, soprattutto quando i risultati sono a rischio. KPI

Anti-pattern comuni:

  • Si impostano troppi avvisi non critici, con conseguente affaticamento da avvisi ("alert fatigue").

  • Non si dà priorità agli avvisi in base aKPIs, il che rende difficile comprendere l'impatto aziendale dei problemi.

  • Non si affrontano le cause principali porta a ricevere avvisi ripetuti per lo stesso problema.

Vantaggi dell'adozione di questa best practice:

  • Riduzione dell'affaticamento da avvisi ("alert fatigue") concentrandosi su avvisi pertinenti e fruibili.

  • Maggiore operatività e affidabilità del sistema grazie al rilevamento e alla mitigazione proattiva dei problemi.

  • Migliore collaborazione tra team e risoluzione più rapida dei problemi grazie all'integrazione con i più diffusi strumenti di avviso e comunicazione.

Livello di rischio associato se questa best practice non fosse adottata: elevato

Guida all'implementazione

Per creare un meccanismo di avviso efficace, è fondamentale utilizzare metriche, log e dati di tracciamento che segnalino quando i risultati basati su KPIs sono a rischio o vengono rilevate anomalie.

Passaggi dell'implementazione

  1. Determina gli indicatori chiave di prestazione (KPIs): identifica quelli della tua applicazione. KPIs Gli avvisi devono essere collegati a questi KPIs per riflettere accuratamente l'impatto aziendale.

  2. Implementa il rilevamento delle anomalie:

    • Usa il rilevamento delle CloudWatch anomalie di Amazon: configura il rilevamento delle CloudWatch anomalie di Amazon per rilevare automaticamente modelli insoliti, il che ti aiuta a generare avvisi solo per anomalie autentiche.

    • AWS X-Ray Usa Insights:

      1. Configura X-Ray Insights per la rilevazione delle anomalie nei dati di tracciamento.

      2. Configura le notifiche per X-Ray Insights così da ricevere avvisi sui problemi rilevati.

    • Integrazione con Amazon DevOps Guru:

      1. Sfrutta Amazon DevOps Guru per le sue capacità di machine learning nel rilevare anomalie operative con i dati esistenti.

      2. Accedi alle impostazioni di notifica in DevOps Guru per configurare avvisi di anomalia.

  3. Implementa avvisi fruibili: progetta avvisi che forniscano informazioni adeguate per intraprendere un'azione immediata.

    1. Monitora AWS Health gli eventi con EventBridge le regole di Amazon o esegui l'integrazione programmatica con le AWS Health API per automatizzare le azioni quando ricevi AWS Health eventi. Può trattarsi di azioni generali, come l'invio di tutti i messaggi pianificati sugli eventi del ciclo di vita a un'interfaccia di chat, oppure azioni specifiche, come l'avvio di un flusso di lavoro in uno strumento di gestione dei servizi IT.

  4. Riduci l'affaticamento dagli avvisi: riduci al minimo gli avvisi non critici. Quando i team sono sovraccaricati da numerosi avvisi insignificanti, possono trascurare i problemi critici, riducendo l'efficacia complessiva del meccanismo di avviso.

  5. Configurazione di allarmi compositi: utilizza gli allarmi CloudWatch compositi di Amazon per consolidare più allarmi.

  6. Integrazione con strumenti di avviso: incorpora strumenti come Ops Genie e. PagerDuty

  7. Coinvolgi AWS Chatbot: integra AWS Chatbotper inoltrare avvisi ad Amazon Chime, Microsoft Teams e Slack.

  8. Avvisi basati sui log: utilizza i filtri metrici di log CloudWatch per creare allarmi basati su eventi di registro specifici.

  9. Rivedi e itera: riesamina e ottimizza regolarmente le configurazioni degli avvisi.

Livello di impegno per il piano di implementazione: medio

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati: