OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro - Framework AWS Well-Architected

OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro

Esegui regolarmente revisioni proattive delle metriche del carico di lavoro per identificare le tendenze, determinare se sia necessaria una risposta e convalidare il raggiungimento dei risultati aziendali. Aggrega le metriche delle applicazioni e dei componenti del carico di lavoro in una posizione centrale. Usa dashboard e strumenti di analisi per analizzare i dati di telemetria e determinare l'integrità del carico di lavoro. Implementa un meccanismo per lo svolgimento periodico di revisioni dell'integrità del carico di lavoro con gli stakeholder nell'organizzazione.

Risultato desiderato:

  • Raccolta delle metriche del carico di lavoro in una posizione centrale.

  • Uso di dashboard e strumenti di analisi per esaminare le tendenze in fatto di integrità del carico di lavoro.

  • Svolgimento di revisioni periodiche delle metriche del carico di lavoro con l'organizzazione.

Anti-pattern comuni:

  • L'organizzazione raccoglie metriche dal carico di lavoro in due piattaforme di osservazione diverse. Non è possibile determinare l'integrità del carico di lavoro perché le piattaforme sono incompatibili.

  • I tassi di errore per un componente del carico di lavoro aumentano lentamente. Questa tendenza non viene rilevata perché l'organizzazione non svolge revisioni periodiche delle metriche del carico di lavoro. Il componente si guasta dopo una settimana, danneggiando il carico di lavoro.

Vantaggi dell'adozione di questa best practice:

  • Maggiore consapevolezza riguardo all'integrità del carico di lavoro e alla realizzazione dei risultati aziendali.

  • Possibilità di sviluppare le tendenze in fatto di integrità del carico di lavoro nel corso del tempo.

Livello di rischio associato alla mancata adozione di questa best practice: elevato

Guida all'implementazione

Raccogli le metriche del carico di lavoro in una posizione centrale. Usando dashboard e strumenti di analisi, esamina le metriche del carico di lavoro per ottenere informazioni dettagliate sulla sua integrità, sviluppare tendenze in fatto di integrità e convalidare la realizzazione dei risultati aziendali. Implementa un meccanismo per lo svolgimento di revisioni periodiche delle metriche del carico di lavoro.

Esempio del cliente

AnyCompany Retail svolge revisioni delle metriche del carico di lavoro il mercoledì di ogni settimana. L'azienda riunisce tutti gli stakeholder ed esamina le metriche della settimana precedente. Durante la riunione, vengono evidenziate le tendenze e le informazioni dettagliate raccolte dagli strumenti di analisi. Vengono pubblicate dashboard interne con le principali metriche del carico di lavoro, che qualsiasi dipendente può visualizzare e interrogare.

Passaggi dell'implementazione

  1. Identifica le metriche del carico di lavoro associate alla sua integrità. Partendo dai KPI aziendali, identifica le metriche per le applicazioni, i componenti e le piattaforme che forniscono una visione complessiva dell'integrità del carico di lavoro.

    1. Puoi pubblicare metriche personalizzate in Amazon CloudWatch. Puoi utilizzare l'agente Amazon CloudWatch per raccogliere metriche e log da istanze Amazon EC2 e server on-premise.

    2. AWS Distro per OpenTelemetry può raccogliere metriche da applicazioni esistenti e aggiungerne di nuove.

    3. I clienti con un piano di supporto Enterprise possono richiedere il workshop sulla creazione di una strategia di monitoraggio al proprio Technical Account Manager. Questo workshop aiuta a sviluppare una strategia di visibilità per il tuo carico di lavoro.

  2. Raccogli le metriche del carico di lavoro in una posizione centrale. Se le metriche del carico di lavoro sono suddivise tra piattaforme diverse, può essere difficile analizzare e sviluppare le tendenze. La piattaforma deve includere dashboard e funzionalità di analisi.

    1. Amazon CloudWatch può raccogliere e archiviare le metriche del carico di lavoro. In topologie con più account è consigliabile predisporre un account di registrazione e monitoraggio centrale, noto come account archivio dei log.

  3. Crea una dashboard consolidata delle metriche del carico di lavoro. Usa questa visualizzazione per le revisioni delle metriche e l'analisi delle tendenze.

    1. Puoi creare dashboard CloudWatch personalizzate per raccogliere le metriche del carico di lavoro in una visualizzazione consolidata.

  4. Implementa un processo di revisione delle metriche del carico di lavoro. Esamina le metriche del carico di lavoro ogni settimana, ogni due settimane o ogni mese con gli stakeholder, incluso il personale tecnico e non tecnico. Usa queste sessioni di revisione per identificare le tendenze e ottenere informazioni dettagliate sull'integrità del carico di lavoro.

Livello di impegno per il piano di implementazione: elevato Se le metriche del carico di lavoro non vengono raccolte a livello centrale, può essere necessario un investimento significativo per consolidarle in un'unica piattaforma.

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati:

Servizi correlati: