OPS08-BP01 Analizza le metriche del carico di lavoro

Dopo aver implementato la telemetria dell'applicazione, analizza regolarmente le metriche raccolte. Sebbene latenza, richieste, errori e capacità (o quote) forniscano informazioni dettagliate sulle prestazioni del sistema, è fondamentale dare priorità alla revisione delle metriche relative ai risultati aziendali. Ciò ti assicura di prendere decisioni basate sui dati in linea con i tuoi obiettivi aziendali.

Risultato desiderato: informazioni dettagliate sulle prestazioni del carico di lavoro che guidano decisioni basate sui dati, garantendo l'allineamento con gli obiettivi aziendali.

Anti-pattern comuni:

Analisi isolata delle metriche senza considerare il loro impatto sui risultati aziendali.
Eccessiva dipendenza dalle metriche tecniche trascurando quelle aziendali.
Revisione poco frequente delle metriche, perdita di opportunità di prendere decisioni in tempo reale.

Vantaggi dell'adozione di questa best practice:

Comprensione migliorata della correlazione tra prestazioni tecniche e risultati aziendali.
Processo decisionale migliorato basato su dati in tempo reale.
Identificazione e mitigazione proattive dei problemi prima che influiscano sui risultati aziendali.

Livello di rischio associato se questa best practice non fosse adottata: medio

Guida all'implementazione

Sfrutta strumenti come Amazon CloudWatch per eseguire analisi metriche. AWS servizi come il rilevamento delle CloudWatch anomalie e Amazon DevOps Guru possono essere utilizzati per rilevare anomalie, soprattutto quando le soglie statiche sono sconosciute o quando i modelli di comportamento sono più adatti al rilevamento delle anomalie.

Passaggi dell'implementazione

Analizza e revisiona: revisiona e interpreta regolarmente le metriche relative al carico di lavoro.
1. Dai priorità alle metriche relative ai risultati aziendali rispetto a quelle puramente tecniche.
2. Comprendi l'importanza di picchi, cali o schemi nei dati.
Utilizza Amazon CloudWatch: utilizza Amazon CloudWatch per una visualizzazione centralizzata e un'analisi approfondita.
1. Configura le CloudWatch dashboard per visualizzare le tue metriche e confrontarle nel tempo.
2. Usa i percentili CloudWatch per avere una visione chiara della distribuzione delle metriche, che può aiutarti a definire e comprendere i valori anomali. SLAs
3. Imposta il rilevamento delle CloudWatch anomalie per identificare modelli insoliti senza fare affidamento su soglie statiche.
4. Implementa l'osservabilità CloudWatch tra più account per monitorare e risolvere i problemi delle applicazioni che si estendono su più account all'interno di una regione.
5. Utilizza CloudWatch Metric Insights per interrogare e analizzare i dati metrici tra account e regioni, identificando tendenze e anomalie.
6. CloudWatch Applica Metric Math per trasformare, aggregare o eseguire calcoli sulle tue metriche per ottenere informazioni più approfondite.
Utilizza Amazon DevOps Guru: incorpora Amazon DevOps Guru per il suo rilevamento delle anomalie potenziato dall'apprendimento automatico per identificare i primi segnali di problemi operativi per le tue applicazioni serverless e risolverli prima che abbiano un impatto sui tuoi clienti.
Ottimizza in base agli approfondimenti: prendi decisioni informate sulla base dell'analisi delle metriche per adeguare e migliorare i carichi di lavoro.

Livello di impegno per il piano di implementazione: medio

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati:

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

OPS 8. Come utilizzi l'osservabilità del carico di lavoro nella tua organizzazione?

OPS08-BP02 Analizza i registri dei carichi di lavoro