Amazon ECS 서비스 - Amazon Elastic Container Service

Amazon ECS 서비스

Amazon ECS 서비스를 사용하면 Amazon ECS 클러스터에서 지정된 수의 태스크 정의 인스턴스를 동시에 실행하고 유지 관리할 수 있습니다. 태스크가 실패하거나 중지되면 Amazon ECS 서비스 스케줄러가 태스크 정의의 다른 인스턴스를 시작하여 해당 태스크를 대체합니다. 이렇게 하면 서비스에서 원하는 수의 태스크를 유지 관리하는 데 도움이 됩니다.

또한 선택적으로 로드 밸런서 뒤에서 서비스를 실행할 수도 있습니다. 로드 밸런서는 서비스와 연결된 태스크 간에 트래픽을 분산합니다.

서비스 스케줄러는 장기 실행 상태 비저장 서비스 및 애플리케이션에 사용하는 것이 좋습니다. 서비스 스케줄러는 지정한 일정 전략을 따르는지 확인하고 태스크가 실패하는 경우 태스크 일정을 조정합니다. 예를 들어 기본 인프라가 실패하면 서비스 스케줄러가 태스크 일정을 조정합니다. 작업 배치 전략과 제약 조건을 사용하여 스케줄러가 태스크를 배치하고 종료하는 방법을 사용자 지정할 수 있습니다. 서비스의 태스크가 중지되는 경우 스케줄러는 새 태스크를 시작하여 대체합니다. 이 프로세스는 서비스가 사용하는 일정 전략에 따라 서비스가 원하는 태스크 수에 도달할 때까지 계속됩니다. 서비스의 일정 전략은 서비스 유형이라고도 합니다.

또한 서비스 스케줄러는 컨테이너 상태 확인 또는 로드 밸런서 대상 그룹 상태 확인이 실패한 후 비정상으로 확인된 작업을 대체합니다. 이러한 대체는 maximumPercentdesiredCount 서비스 정의 파라미터에 따라 달라집니다. 작업이 비정상으로 표시되면 서비스 스케줄러는 먼저 대체 작업을 시작합니다. 그러면 다음과 같이 진행됩니다.

  • 대체 작업의 상태가 HEALTHY인 경우 서비스 스케줄러는 비정상 작업을 중지합니다.

  • 대체 작업의 상태가 UNHEALTHY이면, 스케줄러는 비정상 대체 작업 또는 기존의 비정상 작업을 중지하여 총 작업 수가 desiredCount와 같아지도록 합니다.

maximumPercent 파라미터로 인해 스케줄러가 대체 작업을 먼저 시작하는 것이 제한되는 경우, 스케줄러는 비정상 작업을 한 번에 하나씩 임의로 중지하여 용량을 확보한 다음 대체 작업을 시작합니다. 비정상 작업이 모두 정상 작업으로 대체될 때까지 시작 및 중지 프로세스가 계속됩니다. 비정상 작업이 모두 대체되고 정상 작업만 실행 중인 경우 총 작업 수가 desiredCount를 초과하면 총 작업 수가 desiredCount와 같아질 때까지 정상 작업을 무작위로 중지합니다. maximumPercentdesiredCount에 대한 자세한 정보는 Service definition parameters를 참조하세요.

서비스 스케줄러에는 태스크가 반복적으로 시작하는 데 실패할 경우 태스크가 다시 시작되는 빈도를 제한하는 로직이 포함됩니다. 태스크가 RUNNING 상태가 되지 않고 중지된 경우, 서비스 스케줄러는 시작 시도 속도를 늦추기 시작하고 서비스 이벤트 메시지를 전송합니다. 이 동작은 해당 문제를 해결하기 전에 실패한 태스크에 불필요한 리소스가 사용되는 것을 방지합니다. 서비스가 업데이트되면 서비스 스케줄러는 정상적인 예약 동작을 다시 시작합니다. 자세한 정보는 Amazon ECS 서비스 제한 로직Amazon ECS 서비스 이벤트 메시지 보기 섹션을 참조하세요.

사용 가능한 서비스 스케줄러 전략으로 다음 두 가지가 있습니다.

  • REPLICA—복제본 일정 전략은 클러스터에 원하는 작업 수를 배치하고 유지합니다. 기본적으로 서비스 스케줄러는 가용 영역에 태스크를 분산합니다. 작업 배치 전략과 제약을 사용하여 작업 배치 결정을 사용자 지정할 수 있습니다. 자세한 내용은 복제본 전략 섹션을 참조하세요.

  • DAEMON—데몬 일정 전략은 사용자가 클러스터에 지정하는 작업 배치 제약을 모두 충족하는 각 활성 컨테이너 인스턴스에 한 작업씩 정확히 배포합니다. 이 전략을 사용하는 경우 원하는 태스크 수, 작업 배치 전략을 지정하거나 서비스 Auto Scaling 정책을 사용할 필요가 없습니다. 자세한 내용은 대몬 전략 단원을 참조하십시오.

    참고

    Fargate 태스크는 DAEMON 일정 전략을 지원하지 않습니다.

대몬 전략

대몬(Daemon) 일정 전략은 클러스터에 지정된 작업 배치 제약을 모두 충족하는 각 활성 컨테이너 인스턴스에 한 작업씩 정확히 배포합니다. 서비스 스케줄러는 실행 중인 태스크에 대한 작업 배치 제약을 평가하고 배치 제약을 충족하지 않는 태스크를 중지합니다. 이 전략을 사용하는 경우 원하는 태스크 수와 태스크 배치 전략을 지정하거나 서비스 Auto Scaling 정책을 사용할 필요가 없습니다.

Amazon ECS는 대몬 태스크를 위해 CPU, 메모리 및 네트워크 인터페이스를 포함한 컨테이너 인스턴스 컴퓨팅 리소스를 예약합니다. 다른 복제 서비스가 있는 클러스터에서 대몬 서비스를 시작하면 Amazon ECS가 대몬 태스크를 우선순위로 지정합니다. 즉, 대몬 태스크는 인스턴스에서 가장 먼저 실행되는 태스크이며 모든 복제본 태스크가 중지된 후 마지막으로 중지되는 태스크입니다. 이 전략은 보류 중인 복제 태스크에서 리소스를 사용하지 않고 대몬 작업에 사용할 수 있도록 합니다.

대몬 서비스 스케줄러는 DRAINING 상태인 인스턴스에는 어떤 태스크도 배치하지 않습니다. 컨테이너 인스턴스가 DRAINING 상태로 전환하면 이 컨테이너 인스턴스에 대한 대몬 태스크가 중지됩니다. 또한 클러스터에 새 컨테이너 인스턴스가 추가되는지 모니터링하고 새 컨테이너 인스턴스에 대몬 태스크를 추가합니다.

배포 구성을 지정할 때 maximumPercent 파라미터의 값은 설정하지 않은 경우 기본값으로 사용되는 100(백분율로 지정)이어야 합니다. minimumHealthyPercent 파라미터의 기본값은 0(비율로 지정)입니다.

대몬 서비스의 배치 제약을 변경할 때 서비스를 다시 시작해야 합니다. Amazon ECS는 대몬 태스크에 적합한 인스턴스에 예약된 리소스를 동적으로 업데이트합니다. 기존 인스턴스의 경우 스케줄러는 인스턴스에 태스크를 배치하려고 시도합니다.

작업 정의에서 작업 크기 또는 컨테이너 리소스 예약을 변경하면 새 배포가 시작됩니다. Amazon ECS는 대몬에 대한 업데이트된 CPU 및 메모리 예약을 선택한 다음, 대몬 작업에 대한 해당 용량을 차단합니다.

위의 경우 중 하나에 대한 리소스가 부족하면 다음과 같은 상황이 발생합니다.

  • 작업 배치가 실패합니다.

  • CloudWatch 이벤트가 생성됩니다.

  • Amazon ECS는 리소스를 사용할 수 있을 때까지 기다리면서 인스턴스에 대한 태스크를 계속 시도하고 예약합니다.

  • Amazon ECS는 더 이상 배치 제약 기준을 충족하지 않는 예약 인스턴스를 확보하고 해당 대몬 태스크를 중지합니다.

대몬 일정 전략은 다음과 같은 경우에 사용할 수 있습니다.

  • 애플리케이션 컨테이너 실행

  • 로깅, 모니터링 및 추적 태스크를 위한 지원 컨테이너 실행

Fargate 시작 유형이나 CODE_DEPLOY 또는 EXTERNAL 배포 컨트롤러 유형을 사용하는 태스크는 대몬 일정 전략을 지원하지 않습니다.

서비스 스케줄러는 실행 태스크를 중지할 때 클러스터의 가용 영역 간에 밸런싱을 유지하려고 합니다. 스케줄러는 다음 로직을 사용합니다.

  • 배치 전략이 정의된 경우 해당 전략을 사용하여 종료할 태스크를 선택합니다. 예를 들어 서비스에 가용 영역 분산 전략이 정의되어 있으면, 나머지 태스크를 최적 분산 상태로 만드는 태스크가 선택됩니다.

  • 정의된 배치 전략이 없으면 다음 로직을 사용하여 클러스터 내 가용 영역 간 밸런스를 유지 관리합니다.

    • 유효한 컨테이너 인스턴스를 정렬합니다. 해당 가용 영역에서 이 서비스에 대해 실행되고 있는 태스크의 수가 가장 많은 인스턴스에 우선순위가 지정됩니다. 예를 들어 영역 A에는 실행 중인 서비스 태스크가 1개이고 영역 B 및 C에는 2개일 경우, 영역 B 또는 C의 컨테이너 인스턴스가 종료에 최적인 것으로 간주됩니다.

    • 이전 단계에 따라 최적 가용 영역의 컨테이너 인스턴스에서 태스크를 중지합니다. 이 서비스에 대해 실행 중인 태스크 수가 가장 많은 컨테이너 인스턴스를 우선으로 합니다.

복제본 전략

복제본 일정 전략은 클러스터에 원하는 작업 수를 배치하고 유지합니다.

Fargate에서 작업을 실행하는 서비스의 경우, 서비스 스케줄러가 새 작업을 시작하거나 실행 중인 작업을 중지하면 서비스 스케줄러는 가용 영역 간의 밸런스를 유지하려고 최선을 다합니다. 작업 배치 전략이나 제약을 지정할 필요가 없습니다.

EC2 인스턴스에서 태스크를 실행하는 서비스를 생성할 때, 선택적으로 작업 배치 전략과 제약 조건을 지정하여 작업 배치 결정을 사용자 지정할 수 있습니다. 작업 배치 전략이나 제약 조건이 지정되지 않은 경우, 서비스 스케줄러는 기본적으로 가용 영역 간 태스크를 분산합니다. 서비스 스케줄러는 다음 로직을 사용합니다.

  • 클러스터에서 어느 컨테이너 인스턴스가 서비스의 태스크 정의를 지원할 수 있는지 판단합니다(예: 필요한 CPU, 메모리, 포트, 컨테이너 인스턴스 속성).

  • 서비스에 대해 정의된 배치 제약을 어느 컨테이너 인스턴스가 충족하는지 판단합니다.

  • 대몬(daemon) 서비스에 의존하는 복제 서비스(예: 작업에서 로깅을 사용하려면 먼저 실행해야 하는 대몬(daemon) 로그 라우터 작업)가 있는 경우, 대몬(daemon) 서비스 작업이 복제 서비스 작업보다 먼저 EC2 인스턴스에 배치되도록 작업 배치 제약을 생성합니다. 자세한 내용은 Amazon ECS 작업 배치 제약 조건 예제 단원을 참조하십시오.

  • 배치 전략이 정의되어 있으면 해당 전략을 사용하여 나머지 후보에서 인스턴스를 선택합니다.

  • 배치 전략이 정의되어 있지 않으면 다음 로직을 사용하여 클러스터의 가용 영역 사이로 태스크를 분산합니다.

    • 유효한 컨테이너 인스턴스를 정렬합니다. 해당 가용 영역에서 이 서비스에 대해 실행되고 있는 태스크의 수가 가장 적은 인스턴스에 우선순위가 지정됩니다. 예를 들어 영역 A에는 실행 중인 서비스 작업이 1개이고, 영역 B 및 C에는 0개일 경우 영역 B 또는 C가 최적 배치로 간주됩니다.

    • 이전 단계에 따라 최적 가용 영역의 유효한 컨테이너 인스턴스에서 새 서비스 태스크를 배치합니다. 이 서비스에 대해 실행 중인 태스크 수가 가장 적은 컨테이너 인스턴스를 우선으로 합니다.