OPS04-BP04 Implementazione della telemetria delle dipendenze
Progetta e configura il carico di lavoro affinché fornisca informazioni sullo stato delle risorse da cui dipende. Si tratta di risorse esterne rispetto al tuo carico di lavoro. Esempi di dipendenze esterne possono includere database esterni, DNS e connettività di rete. Usa queste informazioni per stabilire quando è richiesta una risposta e offri un contesto aggiuntivo sullo stato del carico di lavoro.
Risultato desiderato:
-
Il tuo carico di lavoro emetta dati di telemetria sullo stato delle dipendenze esterne.
-
Ricevi una notifica quando le dipendenze non sono integre.
Anti-pattern comuni:
-
Gli utenti non riescono a raggiungere il tuo sito. Non è possibile determinare se il motivo è un problema DNS senza eseguire manualmente un controllo per verificare se il provider DNS funziona.
-
L'applicazione correlata al carrello non è in grado di completare le transazioni. Non sei in grado di determinare se si tratta di un problema con il provider di elaborazione della carta di credito senza contattarlo per verificarlo.
Vantaggi dell'adozione di questa best practice:
-
Il monitoraggio delle dipendenze esterne offre notifiche in anticipo dei problemi.
-
La conoscenza dello stato di integrità delle tue dipendenze ti supporta nella risoluzione dei problemi.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Collabora con le parti interessate per identificare le dipendenze esterne da cui dipende il tuo carico di lavoro. Le dipendenze esterne possono includere database esterni, API o connettività di rete tra il carico di lavoro e le risorse in altri ambienti. Sviluppa una strategia di monitoraggio per offrire informazioni sullo stato di integrità delle dipendenze e invia allarmi in modo proattivo nel caso si verifichi un cambiamento allo stato.
Esempio del cliente
Il carico di lavoro dell'e-commerce di AnyCompany Retail si affida a un database che si trova in un altro ambiente. Ogni notte, i dati vengono popolati nel database per l'uso con la piattaforma di e-commerce. La connettività di rete e il supporto al database sono di competenza di altri team. Il team di e-commerce ha configurato diversi allarmi canary per ricevere avvisi in caso di problemi di connettività della rete, se il database non è raggiungibile e quando il processo non viene completato.
Passaggi dell'implementazione
-
identifica le dipendenze esterne a cui si affida il tuo carico di lavoro. Implementa la telemetria per monitorare l'integrità o la reperibilità delle dipendenze.
-
I clienti AWS possono usare AWS Health Dashboard per monitorare l'integrità dei servizi AWS e ricevere notifiche sugli eventi correlati.
-
Amazon CloudWatch Synthetics può essere utilizzato per monitorare API, URL e contenuti del sito Web.
-
-
Configura gli allarmi per avvisare la tua organizzazione quando una dipendenza non è raggiungibile o è in uno stato non integro.
-
I clienti con il piano di supporto Enterprise possono richiedere il Workshop Creare una strategia di monitoraggio
al proprio Technical Account Manager. Questo workshop aiuta a sviluppare una strategia di visibilità per il tuo carico di lavoro.
-
-
Identifica i contatti delle dipendenze per i casi in cui la dipendenza non è integra. Documenta come contattare il proprietario della dipendenza, gli accordi per l'assistenza e il processo di escalation.
Livello di impegno per il piano di implementazione: Medio. L'implementazione della telemetria delle dipendenze potrebbe richiedere lo sviluppo di soluzioni di monitoraggio personalizzate.
Risorse
Best practice correlate:
-
OPS04-BP01 Implementazione della telemetria dell'applicazione - Puoi sviluppare il monitoraggio delle dipendenze nella telemetria delle applicazioni.
Documenti correlati:
Video correlati:
Esempi correlati:
Servizi correlati: