OPS08-BP01 Analisi delle metriche del carico di lavoro - Principio dell'eccellenza operativa

OPS08-BP01 Analisi delle metriche del carico di lavoro

Dopo aver implementato la telemetria dell'applicazione, analizza regolarmente le metriche raccolte. Sebbene latenza, richieste, errori e capacità (o quote) forniscano informazioni dettagliate sulle prestazioni del sistema, è fondamentale dare priorità alla revisione delle metriche relative ai risultati aziendali. Ciò ti assicura di prendere decisioni basate sui dati in linea con i tuoi obiettivi aziendali.

Risultato desiderato: Informazioni dettagliate sulle prestazioni del carico di lavoro che guidano decisioni basate sui dati, garantendo l'allineamento con gli obiettivi aziendali.

Anti-pattern comuni:

  • Analisi isolata delle metriche senza considerare il loro impatto sui risultati aziendali.

  • Eccessiva dipendenza dalle metriche tecniche trascurando quelle aziendali.

  • Revisione poco frequente delle metriche, perdita di opportunità di prendere decisioni in tempo reale.

Vantaggi dell'adozione di questa best practice:

  • Comprensione migliorata della correlazione tra prestazioni tecniche e risultati aziendali.

  • Processo decisionale migliorato basato su dati in tempo reale.

  • Identificazione e mitigazione proattive dei problemi prima che influiscano sui risultati aziendali.

Livello di rischio associato se questa best practice non fosse adottata: medio

Guida all'implementazione

Sfrutta strumenti come Amazon CloudWatch per l'esecuzione di analisi delle metriche. Utilizza servizi AWS come AWS Cost Anomaly Detection e Amazon DevOps Guru per rilevare anomalie, soprattutto quando le soglie statiche non sono conosciute o quando i modelli di comportamento evidenziano possibili anomalie.

Passaggi dell'implementazione

  1. Analizza e revisiona: revisiona e interpreta regolarmente le metriche relative al carico di lavoro.

    1. Dai priorità alle metriche relative ai risultati aziendali rispetto a quelle puramente tecniche.

    2. Comprendi l'importanza di picchi, cali o schemi nei dati.

  2. Utilizza Amazon CloudWatch: utilizza Amazon CloudWatch per una visualizzazione centralizzata e un'analisi approfondita.

    1. Configura dashboard CloudWatch per visualizzare le tue metriche e confrontarle nel tempo.

    2. Utilizza percentili in CloudWatch per avere una visione chiara della distribuzione delle metriche, il che può aiutarti a definire gli SLA e a identificare valori anomali.

    3. Configura AWS Cost Anomaly Detection per identificare modelli insoliti senza fare affidamento su soglie statiche.

    4. Implementa l'osservabilità CloudWatch tra account per monitorare e risolvere i problemi delle applicazioni che si estendono su più account all'interno di una regione.

    5. Utilizza gli approfondimenti sulle metriche CloudWatch per interrogare e analizzare i dati delle metriche tra account e regioni, identificando tendenze e anomalie.

    6. Applica Metrica matematica CloudWatch per trasformare, aggregare o eseguire calcoli sulle metriche per ottenere informazioni più approfondite.

  3. Impiega Amazon DevOps Guru: incorpora Amazon DevOps Guru per il rilevamento delle anomalie basato sul machine learning, che consente di identificare i primi segnali di problemi operativi che riguardano le applicazioni serverless e di correggerli prima che abbiano un impatto sui clienti.

  4. Ottimizza in base agli approfondimenti: prendi decisioni informate sulla base dell'analisi delle metriche per adeguare e migliorare i carichi di lavoro.

Livello di impegno per il piano di implementazione: medio

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati: