Automatizzazione di cluster ricorrenti con AWS Data Pipeline - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Automatizzazione di cluster ricorrenti con AWS Data Pipeline

AWS Data Pipeline è un servizio che consente di automatizzare il trasferimento e la trasformazione di dati. Puoi utilizzare questo metodo per programmare il trasferimento di dati di input a Amazon S3 e l'avvio di cluster per elaborare quei dati. Ad esempio, immaginiamo che disponi di un server Web che registra log di traffico. Se si desidera eseguire un cluster settimanale per analizzare i dati di traffico, è possibile utilizzare AWS Data Pipeline per programmare tali cluster. AWS Data Pipeline è un flusso di lavoro basato sui dati, in modo che un'attività (avviando il cluster) possa essere dipendente da un'altra attività (trasferendo i dati di input ad Amazon S3). Dispone inoltre di una potente caratteristica di ripetizione tentativi.

Per ulteriori informazioni su AWS Data Pipeline, consulta la Guida per gli sviluppatori di AWS Data Pipeline, in particolare i tutorial relativi ad Amazon EMR: