Task Runner로 작업하기 - AWS Data Pipeline

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Task Runner로 작업하기

Task Runner는 예약된 작업을 AWS Data Pipeline 폴링하여 Amazon EC2 인스턴스, Amazon EMR 클러스터 또는 기타 컴퓨팅 리소스에서 실행하여 상태를 보고하는 작업 에이전트 애플리케이션입니다. 애플리케이션에 따라 다음을 선택할 수 있습니다.

  • 하나 이상의 AWS Data Pipeline Task Runner 애플리케이션을 설치 및 관리할 수 있습니다. 파이프라인이 활성화되면 활동 RunSon 필드에서 참조하는 기본 Ec2Instance 또는 EmrCluster 객체가 자동으로 생성됩니다. AWS Data Pipeline EC2 인스턴스 또는 EMR 클러스터의 마스터 노드에 Task Runner를 설치합니다. 이 패턴에서는 대부분의 인스턴스 또는 클러스터 관리를 대신 수행할 AWS Data Pipeline 수 있습니다.

  • 사용자가 관리하는 리소스에서 파이프라인 전부 또는 일부를 실행합니다. 잠재적 리소스에는 장시간 실행되는 Amazon EC2 인스턴스, Amazon EMR 클러스터 또는 물리적 서버가 포함됩니다. 웹 서비스와 통신할 수 있다면 작업 실행기 (Task Runner 또는 사용자가 직접 고안한 사용자 지정 작업 에이전트) 를 거의 모든 곳에 설치할 수 있습니다. AWS Data Pipeline 이 패턴에서, 사용되는 리소스와 그 관리 방식을 거의 완벽하게 제어한다고 가정할 때, Task Runner를 수동으로 설치하여 구성해야 합니다. 그럴려면 Task Runner를 사용하여 기존 리소스에서 작업 실행의 설명대로 이 단원에 나오는 절차를 사용하십시오.