기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
글로벌 테이블 준비 체크리스트
글로벌 테이블을 배포할 때 의사 결정 및 작업에 다음 체크리스트를 사용하세요.
-
사용 사례가 MRSC 또는 MREC 일관성 모드에서 더 많은 이점을 얻을 수 있는지 확인합니다. 지연 시간이 길고 다른 장단점이 있더라도 강력한 일관성이 필요합니까?
-
글로벌 테이블에 참여해야 하는 리전과 리전 수를 결정합니다. MRSC를 사용하려는 경우 세 번째 리전을 복제본 또는 감시자로 지정할지 결정합니다.
-
애플리케이션의 쓰기 모드를 결정합니다. (이는 일관성 모드와 동일하지 않습니다.)
-
쓰기 모드에 따라 라우팅 전략을 계획합니다.
-
일관성 모드, 쓰기 모드 및 라우팅 전략을 기반으로 대피 계획을 정의합니다.
-
각 리전의 상태, 지연 시간, 오류에 대한 지표를 캡처합니다. DynamoDB 지표 목록은 블로그 AWS 게시물 운영 인식을 위한 Amazon DynamoDB 모니터링을
참조하세요. 또한 합성 canary(장애를 감지하도록 설계된 인공 요청)와 고객 트래픽의 실시간 관찰을 사용해야 합니다. 모든 문제가 DynamoDB 지표에 나타나는 것은 아닙니다. -
MREC를 사용하는 경우의 지속적인 증가에 대한 경보를 설정합니다
ReplicationLatency
. 증가는 글로벌 테이블의 쓰기 설정이 리전마다 다른 잘못된 구성을 나타낼 수 있습니다. 이는 복제된 요청 실패와 지연 시간 증가로 이어질 수 있습니다. 리전 중단이 있음을 나타낼 수도 있습니다. 좋은 예는 최근 평균이 180,000밀리초를 초과할 경우 알림을 생성하는 것입니다. ReplicationLatency
가 0으로 떨어지는 것을 관찰할 수도 있습니다. 이는 복제가 중단되었음을 나타냅니다. -
각 글로벌 테이블에 충분한 최대 읽기 및 쓰기 설정을 할당합니다.
-
리전을 대피시킬 조건을 식별합니다. 결정에 사람의 판단이 수반되는 경우 모든 고려 사항을 문서화합니다. 이 작업은 압박을 받지 않는 상태에서 사전에 신중하게 수행해야 합니다.
-
리전 대피 시 취해야 하는 모든 조치를 위한 런북을 유지 관리합니다. 일반적으로 글로벌 테이블에 필요한 작업은 거의 없지만 나머지 스택을 이동하는 작업은 복잡할 수 있습니다.
참고
일부 컨트롤 플레인 작업은 리전 장애 발생 시 저하될 수 있으므로 장애 조치 절차에서는 데이터 영역 작업에만 의존하고 컨트롤 플레인 작업에는 의존하지 않는 것이 가장 좋습니다. 자세한 내용은 AWS 블로그 게시물 Build resilient applications with Amazon DynamoDB global tables: Part 4
를 참조하세요. -
리전 대피를 포함하여 런북의 모든 측면을 정기적으로 테스트합니다. 테스트되지 않은 런북은 신뢰할 수 없는 런북입니다.
-
AWS Resilience Hub를 사용하여 전체 애플리케이션(글로벌 테이블 포함)의 복원력을 평가하는 것이 좋습니다. 이 서비스는 대시보드를 통해 애플리케이션 포트폴리오의 복원력 상태를 포괄적으로 보여줍니다.
-
ARC 준비 확인을 사용하여 애플리케이션의 현재 구성을 평가하고 모범 사례와의 차이를 추적하는 것이 좋습니다.
-
Route 53 또는 Global Accelerator와 함께 사용할 상태 확인을 작성할 때 전체 데이터베이스 흐름을 포함하는 일련의 호출을 수행합니다. DynamoDB 엔드포인트가 가동되었는지 확인하도록 검사를 제한하면 AWS Identity and Access Management (IAM) 구성 오류, 코드 배포 문제, DynamoDB 외부 스택의 실패, 평균 읽기 또는 쓰기 지연 시간 초과 등과 같은 많은 실패 모드를 처리할 수 없습니다.