使用 AWS Data Pipeline自動化再次出現的叢集 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Data Pipeline自動化再次出現的叢集

AWS Data Pipeline 是自動化資料移動和轉換的服務。可以使用它來排定將輸入資料移動到 Amazon S3 的時程和排定啟動叢集來處理該資料的時程。例如,假設您有一個記錄流量日誌的 Web 伺服器。如果您想要執行每週叢集來分析流量資料,可以使用 AWS Data Pipeline 來排程這些叢集。 AWS Data Pipeline 是資料驅動的工作流程,因此一個任務 (啟動叢集) 可以依賴於另一個任務 (將輸入資料移至 Amazon S3)。它還具有強大的重試功能。

如需詳細資訊 AWS Data Pipeline,請參閱AWS Data Pipeline 開發人員指南,尤其是 Amazon EMR 相關教學課程: