AWS Data Pipelineでクラスターを自動的に繰り返す - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Data Pipelineでクラスターを自動的に繰り返す

AWS Data Pipeline は、データの移動と変換を自動化するサービスです。これを使用して入力データの Amazon S3 への移動をスケジュールし、クラスターを起動してそのデータを処理するようにスケジュールできます。たとえば、トラフィックログを記録するウェブサーバーがあるとします。毎週クラスターを実行してトラフィックデータを分析する場合は、 を使用してそれらのクラスター AWS Data Pipeline をスケジュールできます。 AWS Data Pipeline はデータ駆動型のワークフローであるため、あるタスク (クラスターの起動) を別のタスク (入力データを Amazon S3 に移動) に依存させることができます。また、強力な再試行機能もあります。

の詳細については AWS Data Pipeline、「 AWS Data Pipeline デベロッパーガイド」、特に Amazon に関するチュートリアルを参照してくださいEMR。