다중 AZ 도메인 구성 - Amazon Elasticsearch Service

문서의 영문과 번역 사이에 충돌이 있는 경우에는 영문 버전을 따릅니다. 번역 버전은 기계 번역을 사용하여 제공합니다.

다중 AZ 도메인 구성

각 AWS 리전은 지리적 개별 영역이며, 가용 영역이라고 알려진 여러 개의 격리된 위치가 있습니다. 서비스 중단 발생 시 데이터 손실을 방지하고 클러스터 가동 중지 시간을 최소화하기 위해 동일한 리전에 있는 두 개 또는 세 개의 가용 영역에 노드를 분산할 수 있습니다. 이를 다중 AZ 구성이라고 합니다.

프로덕션 워크로드를 실행하는 도메인의 경우 다음 구성을 권장합니다.

  • Amazon ES를 통해 세 개의 가용 영역을 지원하는 리전을 선택합니다.

  • 세 개 영역에 도메인을 배포합니다.

  • 전용 마스터 노드와 데이터 노드에 대해 최신 세대 인스턴스 유형을 선택합니다.

  • 세 개의 전용 마스터 노드와 최소 세 개의 데이터 노드를 사용합니다.

  • 클러스터의 인덱스당 복제본을 한 개 이상 생성합니다.

이 단원의 나머지 부분에서는 이러한 권장 사항에 대한 설명과 전후 관계를 제공합니다.

샤드 배포

다중 AZ를 활성화하는 경우, 클러스터의 인덱스당 복제본을 한 개 이상 생성해야 합니다. 복제본이 없으면 Amazon ES가 다른 가용 영역에 데이터 사본을 배포할 수 없으며 이렇게 되면 다중 AZ의 목적을 달성할 수 없습니다. 다행히 모든 인덱스의 기본 구성은 복제본 1개입니다. 다음 다이어그램에서 볼 수 있듯이 Amazon ES에서는 기본 샤드와 해당 복제본 샤드를 최대한 서로 다른 영역에 분산합니다.

가용 영역별로 통해 샤드를 분산시키는 것 외에도 Amazon ES는 샤드를 노드별로 분산시킵니다. 그러나 특정 도메인 구성은 샤드 수가 불균형해질 수 있습니다. 다음 도메인을 생각해 보십시오.

  • 데이터 노드 5개

  • 기본 샤드 5개

  • 복제본 2개

  • 가용 영역 3개

이 경우, Amazon ES는 다음 다이어그램과 같이 기본 샤드와 복제본 샤드를 영역에 분산시키기 위해 한 개의 노드를 오버로드해야 합니다.

개별 노드의 부하를 늘리고 성능을 저하시킬 수 있는 이러한 상황을 피하려면, 인덱스당 두 개 이상의 복제본을 사용하려는 경우 인스턴스 수를 3의 배수로 선택하는 것이 좋습니다.

전용 마스터 노드 분산

도메인을 구성할 때 가용 영역을 두 개 선택하더라도 Amazon ES는 전용 마스터 노드를 세 개의 가용 영역에 자동으로 분산시킵니다. 이러한 분산은 영역에 서비스 중단이 발생할 경우 클러스터 가동 중지를 방지합니다. 권장되는 세 개의 전용 마스터 노드를 사용하면 하나의 가용 영역이 중단되더라도 클러스터가 여전히 전용 마스터 노드의 쿼럼(2)을 유지하므로 새 마스터를 선택할 수 있습니다. 다음 다이어그램은 이 구성을 보여 줍니다.

이 자동 분산에는 몇 가지 주요 예외가 있습니다.

  • 세 개의 가용 영역에서 사용할 수 없는 전 세대 인스턴스 유형을 선택하는 경우 다음 시나리오가 적용됩니다.

    • 도메인에 가용 영역을 세 개 선택하면 Amazon ES가 오류를 반환합니다. 다른 인스턴스 유형을 선택하고 다시 시도하십시오.

    • 도메인에 가용 영역을 두 개 선택하면 Amazon ES가 두 개의 영역에 전용 마스터 노드를 분산시킵니다.

  • 모든 AWS 리전에 세 개의 가용 영역이 있는 것은 아닙니다. 이러한 리전에서는 두 개의 영역만 사용하도록 도메인을 구성할 수 있으며, Amazon ES는 두 개 영역에만 전용 마스터 노드를 분산시킬 수 있습니다.

가용 영역 중단

가용 영역 중단은 드문 경우지만 발생할 수 있습니다. 다음 표에는 중단 시 다양한 다중 AZ 구성과 동작이 나와 있습니다.

리전의 가용 영역 수 선택한 가용 영역 수 전용 마스터 노드 수 한 개의 가용 영역에 중단이 발생할 경우의 동작
2 이상 2 0

가동 중지. 클러스터에서 데이터 노드의 절반이 손실되고 마스터를 선택하기 전에 가용 영역에서 하나 이상의 노드를 교체해야 합니다.

2. 2 3

50/50의 가동 중지 확률. Amazon ES는 하나의 가용 영역에 두 개의 전용 마스터 노드를 분산시키고 하나를 다른 영역에 분산시킵니다.

  • 하나의 전용 마스터 노드가 있는 가용 영역에 장애가 발생하면 나머지 가용 영역에 있는 두 개의 전용 마스터 노드가 마스터로 선택될 수 있습니다.

  • 두 개의 전용 마스터 노드가 있는 가용 영역에 장애가 발생하면 나머지 가용 영역에서 하나의 전용 마스터 노드를 추가하고 마스터로 선택될 수 있을 때까지 클러스터를 사용할 수 없습니다.

3 이상 2 3

가동 중지 없음. Amazon ES는 세 개의 가용 영역에 전용 마스터 노드를 자동으로 분산시키므로 나머지 두 개의 전용 마스터 노드가 마스터로 선택될 수 있습니다.

3 이상 3 0

가동 중지 없음. 약 3분의 2의 데이터 노드가 여전히 마스터로 선택될 수 있습니다.

3 이상 3 3

가동 중지 없음. 나머지 두 개의 전용 마스터 노드가 마스터로 선택될 수 있습니다.

모든 구성에서 원인과 상관없이 노드 장애는 클러스터의 나머지 데이터 노드에서 일정 기간 동안 부하 증가를 유발하며, Amazon ES는 현재 누락된 노드를 교체하도록 새 노드를 자동으로 구성할 수 있습니다.

예를 들어, 3개 영역 구성에서 가용 영역 장애가 발생하는 경우 데이터 노드의 최대 2/3가 클러스터에 대한 요청을 최대한 많이 처리해야 합니다. 이에 따라 나머지 노드들도 온라인 상태가 될 때 새 노드에 샤드를 복제하므로 성능에 더 큰 영향을 미칠 수 있습니다. 워크로드에 가용성이 중요한 경우 이 문제를 최소화하기 위해 클러스터에 리소스를 추가하는 것을 고려하십시오.

참고

Amazon ES에서는 다중 AZ 도메인을 투명하게 관리하므로 가용 영역 중단을 수동으로 시뮬레이션할 수 없습니다.