Task Runner - AWS Data Pipeline

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Task Runner

Task Runner は、ポーリングするタスクエージェントアプリケーションです。AWS Data Pipelineをスケジュールされているタスクで、Amazon EC2 インスタンス、Amazon EMR クラスター、またはその他のコンピューティングリソースで実行すると同時にそのステータスをレポートします。アプリケーションによっては、以下を行うことができます。

  • 許可AWS Data Pipeline1 つ以上の Task Runner アプリケーションをインストールして管理します。パイプラインがアクティブ化されると、デフォルトのEc2InstanceまたはEmrClusterオブジェクトは、アクティビティの RunsOn フィールドによって参照される自動的に作成されます。AWS Data Pipelineは EC2 インスタンスまたは EMR クラスターのマスターノードに Task Runner をインストールします。このパターンでは、AWS Data Pipeline がお客様に代わってインスタンス管理またはクラスター管理のほとんどを行うことができます。

  • パイプラインの全体または一部を、お客様が管理するリソースで実行する。使用可能なリソースには、長時間実行されている Amazon EC2 インスタンス、Amazon EMR クラスター、物理サーバーなどがあります。タスクランナー(Task Runner か、お客様のデバイスにあるカスタムタスクエージェント)は、AWS Data Pipelineウェブサービス。このパターンでは、どのリソースが使用されどのように管理されるかをお客様がほぼ完全に制御できますが、Task Runner は手動でインストールおよび設定する必要があります。これを行うには、「Task Runner を使用した既存のリソースでの作業の実行」に記載されている手順を使用します。