Monitoraggio e debug - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio e debug

Alcune fasi del ciclo di vita dei dati non sono sequenziali ma sono presenti in modo coerente. Questo vale per la fase di monitoraggio e debug, come illustrato nel diagramma seguente.

Diagramma di monitoraggio e debug

Il processo di ingegneria dei dati deve essere continuamente monitorato per verificarne la correttezza e le prestazioni. Amazon CloudWatch svolge un ruolo cruciale nel monitoraggio dell'ingegneria dei dati, poiché registra ogni errore e registro delle informazioni nei suoi gruppi di log. Puoi utilizzare il monitoraggio per creare un ripristino automatico degli errori. Ad esempio, puoi interrompere le pipeline se scopri che le regole di qualità dei dati non sono soddisfatte oppure puoi registrare separatamente le esecuzioni riuscite e quelle non riuscite per abilitare un'azione di ripristino. Il monitoraggio migliora l'affidabilità complessiva del processo di ingegneria dei dati (ovvero l'intero processo ETL) e dei dati.

Inoltre, ti consigliamo di creare CloudWatch dashboard che includano le metriche pertinenti per il processo di monitoraggio e debug. Questo può aiutare a garantire che il processo di ingegneria dei dati funzioni senza intoppi e come previsto. Questo è importante sia per le operazioni che per la rendicontazione. Ad esempio, una CloudWatch dashboard può mostrare agli utenti lo stato dei carichi per aiutarli a comprendere l'affidabilità dei processi, la percentuale di dati eliminata a causa della bassa qualità o le fonti con il maggior numero di errori. Una CloudWatch dashboard non solo consente di visualizzare i risultati, ma aiuta anche a migliorare i processi identificando i punti deboli del processo ETL.