OPS04-BP02 Implementazione della telemetria dell'applicazione - Pilastro dell'eccellenza operativa

OPS04-BP02 Implementazione della telemetria dell'applicazione

La telemetria dell'applicazione è la base su cui si fonda l'osservabilità del carico di lavoro. È fondamentale emettere dati di telemetria che offrano approfondimenti utili sullo stato dell'applicazione e sul raggiungimento degli obiettivi sia tecnici sia aziendali. Dalla risoluzione dei problemi alla misurazione dell'impatto di una nuova funzionalità fino all'allineamento con gli indicatori di prestazione chiave (KPI), la telemetria dell'applicazione garantisce informazioni su cui basare la creazione, il funzionamento e l'evoluzione del carico di lavoro.

Metriche, log e tracce costituiscono i tre pilastri principali dell'osservabilità. Questi operano come strumenti diagnostici che descrivono lo stato dell'applicazione. Nel tempo, aiutano a creare criteri di base e a identificare le anomalie. Tuttavia, per garantire l'allineamento tra le attività di monitoraggio e gli obiettivi aziendali, è fondamentale definire e monitorare i KPI. I KPI aziendali spesso facilitano l'identificazione dei problemi rispetto alle sole metriche tecniche.

Altri tipi di telemetria, come il monitoraggio degli utenti reali (RUM) e le transazioni sintetiche, completano queste origini dati primarie. Il RUM offre approfondimenti sulle interazioni degli utenti in tempo reale, mentre le transazioni sintetiche simulano i potenziali comportamenti degli utenti, aiutando a rilevare i colli di bottiglia prima che vengano riscontrati dagli utenti reali.

Risultato desiderato: ottieni approfondimenti utili sulle prestazioni del tuo carico di lavoro. Questi approfondimenti consentono di prendere decisioni proattive sull'ottimizzazione delle prestazioni, ottenere una maggiore stabilità del carico di lavoro, semplificare i processi CI/CD e utilizzare le risorse in modo efficace.

Anti-pattern comuni:

  • Osservabilità incompleta: trascurare l'incorporazione dell'osservabilità a ogni livello del carico di lavoro, con conseguenti punti ciechi che possono nascondere le prestazioni vitali del sistema e gli approfondimenti sul comportamento.

  • Visualizzazione frammentata dei dati: quando i dati sono sparsi su più strumenti e sistemi, diventa difficile mantenere una visione olistica dello stato e delle prestazioni del carico di lavoro.

  • Problemi segnalati dagli utenti: un segno della mancanza di un rilevamento proattivo dei problemi tramite telemetria e monitoraggio dei KPI aziendali.

Vantaggi dell'adozione di questa best practice:

  • Processo decisionale informato: con gli approfondimenti ricavati dalla telemetria e dai KPI aziendali, puoi prendere decisioni basate sui dati.

  • Migliore efficienza operativa: l'utilizzo delle risorse basato sui dati porta a un miglioramento dell'efficienza risparmiando sui costi.

  • Maggiore stabilità del carico di lavoro: rilevamento e risoluzione più rapidi dei problemi con conseguente aumento dei tempi di attività.

  • Processi CI/CD semplificati: gli approfondimenti ricavati dai dati di telemetria facilitano il perfezionamento dei processi e la distribuzione affidabile del codice.

Livello di rischio associato se questa best practice non fosse adottata: elevato

Guida all'implementazione

Per implementare la telemetria delle applicazioni per il tuo carico di lavoro, utilizza servizi AWS come Amazon CloudWatch e AWS X-Ray. Amazon CloudWatch fornisce una suite completa di strumenti di monitoraggio, che offre osservabilità sulle risorse e le applicazioni in ambienti AWS e on-premises. Raccoglie, tiene traccia e analizza le metriche, consolida e monitora i dati di log e risponde alle modifiche che interessano le risorse, migliorando la comprensione del funzionamento del carico di lavoro. Integrato con altri servizi, AWS X-Ray consente di tenere traccia, analizzare ed eseguire il debug delle applicazioni, offrendoti una comprensione approfondita del comportamento del tuo carico di lavoro. Grazie a funzionalità come mappe dei servizi, distribuzioni di latenza e tempistiche di tracciamento, AWS X-Ray fornisce approfondimenti sulle prestazioni del carico di lavoro e sui colli di bottiglia che lo interessano.

Passaggi dell'implementazione

  1. Identifica quali dati raccogliere: definisci le metriche, i log e le tracce essenziali che potrebbero offrire importanti informazioni dettagliate sullo stato, le prestazioni e il comportamento del tuo carico di lavoro.

  2. Implementa l'agente CloudWatch: l'agente CloudWatch è fondamentale nel fornire metriche di sistema e dell'applicazione e log dal carico di lavoro e dall'infrastruttura sottostante. L'agente CloudWatch può essere utilizzato anche per raccogliere tracciamenti OpenTelemetry o X-Ray e inviarle a X-Ray.

  3. Implementa il rilevamento delle anomalie per log e metriche: sfrutta il rilevamento delle anomalie di CloudWatch Logs e il rilevamento delle anomalie delle metriche di CloudWatch per identificare in automatico le attività insolite nelle operazioni dell'applicazione. Questi strumenti utilizzano algoritmi di machine learning per rilevare e comunicare le anomalie, migliorando le capacità di monitoraggio e accelerando i tempi di risposta a potenziali interruzioni o minacce alla sicurezza. Configura queste funzionalità per gestire in modo proattivo lo stato e la sicurezza delle applicazioni.

  4. Proteggi i dati di log sensibili: utilizza la protezione dei dati di Amazon CloudWatch Logs per mascherare le informazioni sensibili all'interno dei log. Questa funzionalità aiuta a mantenere la privacy e la conformità con il rilevamento e il mascheramento automatici dei dati sensibili prima dell'accesso. Implementa il mascheramento dei dati per gestire e proteggere in modo sicuro i dettagli sensibili come le informazioni di identificazione personale (PII).

  5. Definisci e monitora i KPI aziendali: stabilisci metriche personalizzate in linea con i risultati aziendali.

  6. Dota l'applicazione di strumenti con AWS X-Ray: oltre a implementare l'agente CloudWatch, è fondamentale dotare l'applicazione di strumenti per l'emissione dei dati di tracciamento. Questo processo può fornire ulteriori approfondimenti sul comportamento e sulle prestazioni del carico di lavoro.

  7. Standardizza la raccolta dei dati nell'applicazione: standardizza le pratiche di raccolta dei dati nell'intera applicazione. L'uniformità aiuta a correlare e analizzare i dati, fornendo una visione completa del comportamento dell'applicazione.

  8. Implementa l'osservabilità tra più account: migliora l'efficienza del monitoraggio su più Account AWS con l'osservabilità tra più account di Amazon CloudWatch. Con questa funzionalità, puoi consolidare metriche, log e allarmi di diversi account in un'unica visualizzazione, semplificando la gestione e migliorando i tempi di risposta per i problemi identificati nell'ambiente AWS dell'organizzazione.

  9. Effettua analisi e agisci in base ai dati: una volta raccolti e normalizzati i dati, usa Amazon CloudWatch per l'analisi di log e metriche e AWS X-Ray per analizzare il tracciamento. Tale analisi può fornire approfondimenti cruciali sullo stato, le prestazioni e il comportamento del carico di lavoro, guidando il processo decisionale.

Livello di impegno per il piano di implementazione: elevato

Risorse

Best practice correlate:

Documenti correlati:

Video correlati:

Esempi correlati: