OPS08-BP01 Analisi delle metriche del carico di lavoro
Dopo aver implementato la telemetria dell'applicazione, analizza regolarmente le metriche raccolte. Sebbene latenza, richieste, errori e capacità (o quote) forniscano informazioni dettagliate sulle prestazioni del sistema, è fondamentale dare priorità alla revisione delle metriche relative ai risultati aziendali. Ciò ti assicura di prendere decisioni basate sui dati in linea con i tuoi obiettivi aziendali.
Risultato desiderato: Informazioni dettagliate sulle prestazioni del carico di lavoro che guidano decisioni basate sui dati, garantendo l'allineamento con gli obiettivi aziendali.
Anti-pattern comuni:
-
Analisi isolata delle metriche senza considerare il loro impatto sui risultati aziendali.
-
Eccessiva dipendenza dalle metriche tecniche trascurando quelle aziendali.
-
Revisione poco frequente delle metriche, perdita di opportunità di prendere decisioni in tempo reale.
Vantaggi dell'adozione di questa best practice:
-
Comprensione migliorata della correlazione tra prestazioni tecniche e risultati aziendali.
-
Processo decisionale migliorato basato su dati in tempo reale.
-
Identificazione e mitigazione proattive dei problemi prima che influiscano sui risultati aziendali.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Sfrutta strumenti come Amazon CloudWatch per l'esecuzione di analisi delle metriche. Utilizza servizi AWS come AWS Cost Anomaly Detection e Amazon DevOps Guru per rilevare anomalie, soprattutto quando le soglie statiche non sono conosciute o quando i modelli di comportamento evidenziano possibili anomalie.
Passaggi dell'implementazione
-
Analizza e revisiona: revisiona e interpreta regolarmente le metriche relative al carico di lavoro.
-
Dai priorità alle metriche relative ai risultati aziendali rispetto a quelle puramente tecniche.
-
Comprendi l'importanza di picchi, cali o schemi nei dati.
-
-
Utilizza Amazon CloudWatch: utilizza Amazon CloudWatch per una visualizzazione centralizzata e un'analisi approfondita.
-
Configura dashboard CloudWatch per visualizzare le tue metriche e confrontarle nel tempo.
-
Utilizza percentili in CloudWatch
per avere una visione chiara della distribuzione delle metriche, il che può aiutarti a definire gli SLA e a identificare valori anomali. -
Configura AWS Cost Anomaly Detection per identificare modelli insoliti senza fare affidamento su soglie statiche.
-
Implementa l'osservabilità CloudWatch tra account per monitorare e risolvere i problemi delle applicazioni che si estendono su più account all'interno di una regione.
-
Utilizza gli approfondimenti sulle metriche CloudWatch per interrogare e analizzare i dati delle metriche tra account e regioni, identificando tendenze e anomalie.
-
Applica Metrica matematica CloudWatch per trasformare, aggregare o eseguire calcoli sulle metriche per ottenere informazioni più approfondite.
-
-
Impiega Amazon DevOps Guru: incorpora Amazon DevOps Guru
per il rilevamento delle anomalie basato sul machine learning, che consente di identificare i primi segnali di problemi operativi che riguardano le applicazioni serverless e di correggerli prima che abbiano un impatto sui clienti. -
Ottimizza in base agli approfondimenti: prendi decisioni informate sulla base dell'analisi delle metriche per adeguare e migliorare i carichi di lavoro.
Livello di impegno per il piano di implementazione: medio
Risorse
Best practice correlate:
Documenti correlati:
Video correlati:
Esempi correlati: