Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
OPS08-BP04 Crea avvisi utilizzabili
Rilevare e rispondere tempestivamente alle deviazioni di comportamento dell'applicazione è fondamentale. Particolarmente importante è riconoscere quando i risultati basati sugli indicatori chiave di prestazione (KPIs) sono a rischio o quando si verificano anomalie impreviste. La base degli avvisi KPIs garantisce che i segnali ricevuti siano direttamente collegati all'impatto aziendale o operativo. Questo approccio verso avvisi fruibili promuove risposte proattive e aiuta a mantenere le prestazioni e l'affidabilità del sistema.
Risultato desiderato: ricevi avvisi tempestivi, pertinenti e utilizzabili per identificare e mitigare rapidamente i potenziali problemi, soprattutto quando i risultati sono a rischio. KPI
Anti-pattern comuni:
-
Si impostano troppi avvisi non critici, con conseguente affaticamento da avvisi ("alert fatigue").
-
Non si dà priorità agli avvisi in base aKPIs, il che rende difficile comprendere l'impatto aziendale dei problemi.
-
Non si affrontano le cause principali porta a ricevere avvisi ripetuti per lo stesso problema.
Vantaggi dell'adozione di questa best practice:
-
Riduzione dell'affaticamento da avvisi ("alert fatigue") concentrandosi su avvisi pertinenti e fruibili.
-
Maggiore operatività e affidabilità del sistema grazie al rilevamento e alla mitigazione proattiva dei problemi.
-
Migliore collaborazione tra team e risoluzione più rapida dei problemi grazie all'integrazione con i più diffusi strumenti di avviso e comunicazione.
Livello di rischio associato se questa best practice non fosse adottata: elevato
Guida all'implementazione
Per creare un meccanismo di avviso efficace, è fondamentale utilizzare metriche, log e dati di tracciamento che segnalino quando i risultati basati su KPIs sono a rischio o vengono rilevate anomalie.
Passaggi dell'implementazione
-
Determina gli indicatori chiave di prestazione (KPIs): identifica quelli della tua applicazione. KPIs Gli avvisi devono essere collegati a questi KPIs per riflettere accuratamente l'impatto aziendale.
-
Implementa il rilevamento delle anomalie:
-
Usa il rilevamento delle CloudWatch anomalie di Amazon: configura il rilevamento delle CloudWatch anomalie di Amazon per rilevare automaticamente modelli insoliti, il che ti aiuta a generare avvisi solo per anomalie autentiche.
-
AWS X-Ray Usa Insights:
-
Configura X-Ray Insights per la rilevazione delle anomalie nei dati di tracciamento.
-
Configura le notifiche per X-Ray Insights così da ricevere avvisi sui problemi rilevati.
-
-
Integrazione con Amazon DevOps Guru:
-
Sfrutta Amazon DevOps Guru
per le sue capacità di machine learning nel rilevare anomalie operative con i dati esistenti. -
Accedi alle impostazioni di notifica in DevOps Guru per configurare avvisi di anomalia.
-
-
-
Implementa avvisi fruibili: progetta avvisi che forniscano informazioni adeguate per intraprendere un'azione immediata.
-
Monitora AWS Health gli eventi con EventBridge le regole di Amazon o esegui l'integrazione programmatica con le AWS Health API per automatizzare le azioni quando ricevi AWS Health eventi. Può trattarsi di azioni generali, come l'invio di tutti i messaggi pianificati sugli eventi del ciclo di vita a un'interfaccia di chat, oppure azioni specifiche, come l'avvio di un flusso di lavoro in uno strumento di gestione dei servizi IT.
-
-
Riduci l'affaticamento dagli avvisi: riduci al minimo gli avvisi non critici. Quando i team sono sovraccaricati da numerosi avvisi insignificanti, possono trascurare i problemi critici, riducendo l'efficacia complessiva del meccanismo di avviso.
-
Configurazione di allarmi compositi: utilizza gli allarmi CloudWatch compositi di Amazon per consolidare più allarmi
. -
Integrazione con strumenti di avviso: incorpora strumenti come Ops Genie e. PagerDuty
-
Coinvolgi AWS Chatbot: integra AWS Chatbot
per inoltrare avvisi ad Amazon Chime, Microsoft Teams e Slack. -
Avvisi basati sui log: utilizza i filtri metrici di log CloudWatch per creare allarmi basati su eventi di registro specifici.
-
Rivedi e itera: riesamina e ottimizza regolarmente le configurazioni degli avvisi.
Livello di impegno per il piano di implementazione: medio
Risorse
Best practice correlate:
Documenti correlati:
Video correlati:
Esempi correlati: