OPS08-BP04 Definizione di valori di riferimento per le metriche del carico di lavoro
La definizione di valori di riferimento per le metriche del carico di lavoro semplifica la comprensione dell'integrità e delle prestazioni del carico di lavoro. Usando valori di riferimento, puoi identificare le applicazioni e i componenti che hanno prestazioni eccessive o insufficienti. La definizione di valori di riferimento per il carico di lavoro migliora la tua capacità di mitigare i problemi prima che diventino incidenti. I valori di riferimento sono alla base dello sviluppo di modelli di attività e dell'implementazione del rilevamento delle anomalie quando le metriche deviano dai valori previsti.
Risultato desiderato:
-
Disponibilità di un livello di riferimento per le metriche del carico di lavoro in condizioni normali.
-
Possibilità di determinare se il carico di lavoro funziona normalmente.
Anti-pattern comuni:
-
Dopo aver implementato una nuova funzionalità, la latenza delle richieste peggiora. Non sono stati definiti valori di riferimento per una metrica composita relativa alle richieste in ingresso elaborate e alla latenza complessiva. Non è possibile determinare se la modifica abbia causato un miglioramento o un problema.
-
Si verifica un picco improvviso nell'attività degli utenti, ma non sono stati definiti valori di riferimento per le metriche. Il picco di attività causa gradatamente una perdita di memoria in un'applicazione. Questo problema finisce per portare il carico di lavoro offline.
Vantaggi dell'adozione di questa best practice:
-
Comprensione del modello normale di attività per il carico di lavoro usando metriche per i componenti e le applicazioni principali.
-
Capacità di determinare se il carico di lavoro, le applicazioni e i componenti si comportano normalmente o se è necessario intervenire.
Livello di rischio associato alla mancata adozione di questa best practice: medio
Guida all'implementazione
Usa dati cronologici per definire valori di riferimento per le metriche del carico di lavoro per le applicazioni e i componenti al suo interno. Utilizza valori di riferimento durante le riunioni di revisione delle metriche e per la risoluzione dei problemi. Esamina periodicamente le prestazioni del carico di lavoro e modifica i valori di riferimento in base all'evoluzione dell'architettura.
Esempio del cliente
In AnyCompany Retail vengono definiti valori di riferimento per tutti i componenti e le applicazioni. Usando dati cronologici, AnyCompany Retail ha sviluppato valori di riferimento per le metriche del proprio carico di lavoro in un intervallo di tempo di due mesi. Ogni due mesi l'azienda rivaluta i valori di riferimento e li modifica in base a dati reali.
Passaggi dell'implementazione
-
Procedendo a ritroso dalle metriche del carico di lavoro, definisci valori di riferimento per i componenti e le applicazioni principali usando dati cronologici. Limita il numero di metriche per componente o applicazione ed evita un monitoraggio eccessivo.
-
Puoi usare gli approfondimenti sulle metriche Amazon CloudWatch per eseguire query sulle metriche su larga scala e identificare tendenze e modelli.
-
Il rilevamento delle anomalie in Amazon CloudWatch usa algoritmi di machine learning per identificare i modelli di comportamento per le metriche, determinare valori di riferimento e far emergere le anomalie.
-
Amazon DevOps Guru permette di rilevare i problemi operativi relativi al carico di lavoro usando il machine learning.
-
I clienti con un piano di supporto Enterprise possono richiedere il workshop sulla creazione di una strategia di monitoraggio
al proprio Technical Account Manager. Questo workshop aiuta a creare una strategia di visibilità per il carico di lavoro.
-
-
Implementa un meccanismo per esaminare periodicamente i valori di riferimento delle metriche del carico di lavoro, in particolare prima di eventi aziendali significativi. Almeno una volta a trimestre valuta i valori di riferimento per le metriche del carico di lavoro usando dati cronologici. Usa i valori di riferimento durante le riunioni di revisione delle metriche.
Livello di impegno per il piano di implementazione: basso. Dopo aver stabilito le metriche del carico di lavoro, la definizione di valori di riferimento può richiedere la raccolta di dati sufficienti per identificare i normali modelli di comportamento.
Risorse
Best practice correlate:
-
OPS08-BP02 Definizione delle metriche del carico di lavoro – È necessario innanzitutto definire le metriche del carico di lavoro prima di determinarne i valori di riferimento.
-
OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro – È necessario organizzare la raccolta e l'analisi delle metriche del carico di lavoro prima di definire i valori di riferimento delle metriche.
-
OPS08-BP05 Studio dei modelli di attività previsti per il carico di lavoro – Questa best practice è basata sui valori di riferimento per lo sviluppo delle tendenze di utilizzo.
-
OPS08-BP06 Attivazione di un avviso quando i risultati del carico di lavoro sono a rischio – I valori di riferimento per le metriche sono necessari per identificare le soglie e sviluppare avvisi.
-
OPS08-BP07 Attivazione di un avviso quando vengono rilevate delle anomalie nel carico di lavoro – Il rilevamento delle anomalie richiede la definizione di valori di riferimento per le metriche.
Documenti correlati:
Video correlati:
-
AWS re:Invent 2020: Monitoraggio dei servizi di produzione in Amazon
-
AWS re:Invent 2022: Sviluppo di una strategia di visibilità (COP302)
-
AWS Summit DC 2022: Monitoraggio e visibilità per applicazioni moderne
-
AWS Summit SF 2022 - Visibilità completa e monitoraggio delle applicazioni con AWS (COP310)
Esempi correlati:
Servizi correlati: