OPS08-BP03 Analisi delle tracce del carico di lavoro - Framework AWS Well-Architected

OPS08-BP03 Analisi delle tracce del carico di lavoro

L'analisi dei dati di tracciamento è fondamentale per ottenere una visione completa del percorso operativo di un'applicazione. Visualizzando e comprendendo le interazioni tra i vari componenti, è possibile ottimizzare le prestazioni, identificare i colli di bottiglia e migliorare l'esperienza utente.

Risultato desiderato: ottieni una chiara visibilità sulle operazioni distribuite della tua applicazione, che si traduce in una risoluzione più rapida dei problemi e in un'esperienza utente migliorata.

Anti-pattern comuni:

  • I dati di tracciamento vengono trascurati e ci si affida esclusivamente a log e metriche.

  • I dati di tracciamento non sono correlati ai log associati.

  • Vengono ignorate le metriche derivate dalle tracce, come la latenza e i tassi di errore.

Vantaggi dell'adozione di questa best practice:

  • Miglioramento della risoluzione dei problemi e riduzione del tempo medio di risoluzione (MTTR).

  • Informazioni dettagliate sulle dipendenze e sul loro impatto.

  • Identificazione e correzione rapide dei problemi di prestazione.

  • Vengono sfruttate le metriche derivate dalle tracce per un processo decisionale informato.

  • Esperienze utente migliorate attraverso interazioni con i componenti ottimizzate.

Livello di rischio associato se questa best practice non fosse adottata: medio

Guida all'implementazione

AWS X-Ray offre una suite completa per l'analisi dei dati di tracciamento, fornendo una visione olistica delle interazioni con i servizi, monitorando le attività degli utenti e rilevando i problemi di prestazioni. Funzionalità come ServiceLens, X-Ray Insights, X-Ray Analytics e Amazon DevOps Guru permettono di ottenere informazioni fruibili più approfondite derivate dai dati di tracciamento.

Passaggi dell'implementazione

I seguenti passaggi offrono un approccio strutturato per implementare efficacemente l'analisi dei dati di tracciamento utilizzando i servizi AWS:

  1. Integra AWS X-Ray: assicurati che X-Ray sia integrato con le tue applicazioni per acquisire dati di tracciamento.

  2. Analizza le metriche X-Ray: analizza le metriche derivate dalle tracce di X-Ray, come latenza, tassi di richiesta, percentuale di errore e distribuzione dei tempi di risposta utilizzando la mappa dei servizi per monitorare lo stato delle applicazioni.

  3. Usa ServiceLens: utilizza la mappa di ServiceLens per ottenere una maggiore osservabilità dei servizi e delle applicazioni. Fornisce la visualizzazione integrata di tracce, metriche, log, allarmi e altre informazioni correlate all'integrità.

  4. Abilita X-Ray Insights:

    1. attiva X-Ray Insights per il rilevamento automatico delle anomalie nelle tracce.

    2. Esamina gli approfondimenti per individuare i modelli e determinare le cause ultime, come l'aumento dei tassi di errore o delle latenze.

    3. Consulta la cronologia degli approfondimenti per un'analisi cronologica dei problemi rilevati.

  5. Usa X-Ray Analytics: X-Ray Analytics consente di esplorare a fondo i dati di tracciamento, individuare modelli ed estrarre approfondimenti.

  6. Usa i gruppi in X-Ray: crea i gruppi in X-Ray per filtrare le tracce in base a criteri come l'elevata latenza, per eseguire un'analisi più mirata.

  7. Incorpora Amazon DevOps Guru: integra Amazon DevOps Guru per trarre vantaggio dai modelli di machine learning che individuano le anomalie operative nelle tracce.

  8. Usa CloudWatch Synthetics: usa CloudWatch Synthetics per creare canary per il monitoraggio continuo di endpoint e flussi di lavoro. Questi canary possono integrarsi con X-Ray per fornire dati di tracciamento per un'analisi approfondita delle applicazioni testate.

  9. Usa Real User Monitoring (RUM): con AWS X-Ray e CloudWatch RUM puoi analizzare ed eseguire il debug del percorso della richiesta a partire dagli utenti finali dell'applicazione tramite servizi AWS gestiti a valle. Ciò ti aiuta a identificare le tendenze e gli errori di latenza che hanno un impatto sugli utenti finali.

  10. Esegui correlazioni con i log: esegui correlazioni tra i dati di tracciamento e i relativi log all'interno della vista di tracce di X-Ray per una prospettiva granulare del comportamento delle applicazioni. Ciò consente di visualizzare gli eventi di log associati direttamente alle transazioni tracciate.

  11. Implementa l'osservabilità tra account CloudWatch: monitora e risolvi i problemi delle applicazioni che si estendono su più account all'interno di una regione.

Livello di impegno per il piano di implementazione: medio

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati: