AWS Data Pipeline は、新規顧客には利用できなくなりました。の既存のお客様 AWS Data Pipeline は、通常どおりサービスを引き続き使用できます。詳細はこちら
翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
パイプライン定義
パイプライン定義は、ビジネスロジックを に伝達する方法です AWS Data Pipeline。これには、以下の情報が含まれています。
-
データソースの名前、場所、形式
-
データを変換するアクティビティ
-
これらのアクティビティのスケジュール
-
アクティビティおよび前提条件を実行するリソース
-
アクティビティをスケジュールする前に完了する必要がある前提条件
-
パイプライン実行に伴うステータスの更新を警告する方法
パイプライン定義から、 はタスク AWS Data Pipeline を決定し、スケジュールして、タスクランナーに割り当てます。タスクが正常に完了しなかった場合、 は指示に従ってタスクを AWS Data Pipeline 再試行し、必要に応じて別のタスクランナーに再割り当てします。タスクが繰り返し失敗する場合は、通知するようにパイプラインを設定できます。
例えば、パイプライン定義で、アプリケーションによって生成されたログファイルを、2013 年の各月に Amazon S3 バケットにアーカイブすることを指定できます。 AWS Data Pipeline は、月の日数が 30 日、31 日、28 日、29 日のいずれであるかに関係なく、それぞれが 1 か月分のデータをコピーする 12 個のタスクを作成します。
パイプライン定義は、次のような方法で作成できます。
-
AWS Data Pipeline コンソールを使用してグラフィックで表示
-
コマンドラインインターフェイスで使用される形式の JSON ファイルを記述することによってテキストで作成する
-
いずれかの AWS SDK または AWS Data Pipeline API でウェブサービスを呼び出すことによってプログラムで作成する
パイプライン定義には、次のタイプのコンポーネントを含めることができます。
パイプラインコンポーネント
詳細については、「パイプライン定義ファイルの構文」を参照してください。