REL10-BP01 여러 위치에 워크로드 배포 - 안정성 원칙

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

REL10-BP01 여러 위치에 워크로드 배포

워크로드 데이터와 리소스를 여러 가용 영역에 분산하거나 필요한 경우 AWS 리전전체에 분산합니다. 필요에 따라 이러한 위치는 다양할 수 있습니다.

의 서비스 설계의 기본 원칙 중 하나는 기본 물리적 인프라에서 단일 장애 지점을 방지하는 AWS 것입니다. 이 원칙을 준수하려면 가용 영역 여러 개를 사용하며 단일 영역에서 장애가 발생해도 복원이 가능한 소프트웨어와 시스템을 빌드해야 합니다. 마찬가지로, 시스템은 단일 컴퓨팅 노드, 단일 스토리지 볼륨 또는 단일 데이터베이스 인스턴스에서 장애가 발생하더라도 복원 가능하도록 구축됩니다. 중복 구성 요소에 의존하는 시스템을 구축할 때는 구성 요소가 독립적으로 작동하고 의 경우 AWS 리전자율적으로 작동하는지 확인하는 것이 중요합니다. 중복 구성 요소를 사용한 이론적 가용성 계산에서 얻을 수 있는 이점은 이것이 사실인 경우에만 유효합니다.

가용 영역(AZs)

AWS 리전 는 서로 독립적이도록 설계된 여러 가용 영역으로 구성됩니다. 화재, 홍수, 태풍 등의 자연 재해로 인한 상관 장애 시나리오를 방지하기 위해 각 가용 영역은 서로 멀리 떨어져 있도록 분리됩니다(물리적으로 합리적인 거리). 또한 각 가용 영역에는 독립된 물리적 인프라(다목적 전원에 대한 전용 연결, 대기 백업 전원, 독립 기계 서비스, 가용 영역 내부 및 외부의 독립된 네트워크 연결)가 포함되어 있습니다. 이 설계는 이 시스템 중 하나에서 발생한 장애가 영향을 받은 하나의 가용 영역에만 국한되도록 합니다. 가용 영역은 지리적으로는 분리되지만 같은 지역에 배치되어 높은 처리량과 낮은 지연 시간의 네트워킹이 가능합니다. 전체 AWS 리전 (여러 물리적으로 독립적인 데이터 센터로 구성된 모든 가용 영역)는 데이터를 동기식으로 복제하는 기능(예: 데이터베이스 간)을 포함하여 워크로드에 대한 단일 논리적 배포 대상으로 취급될 수 있습니다. 그러면 액티브/액티브 또는 액티브/대기 구성에서 가용 영역을 사용할 수 있습니다.

가용 영역은 독립적이므로 여러 영역을 사용하도록 워크로드를 설계하면 워크로드 가용성이 향상됩니다. 일부 AWS 서비스(Amazon EC2 인스턴스 데이터 영역 포함)는 해당 서비스에서 가용 영역과 운명을 공유한 엄격한 영역 서비스로 배포됩니다. 하지만 다른 의 Amazon EC2 인스턴스AZs는 영향을 받지 않으며 계속 작동합니다. 마찬가지로, 한 가용 영역에서의 장애로 인해 Amazon Aurora 데이터베이스에 장애가 발생하면 영향을 받지 않은 AZ에 있는 읽기 전용 복제본 Aurora 인스턴스가 자동으로 기본으로 승격될 수 있습니다. 반면 Amazon DynamoDB 등의 리전별 AWS 서비스는 사용자가 AZ 배치를 구성할 필요 없이 해당 서비스에 설정된 가용성 설계 목표를 달성하기 위해 내부적으로 액티브/액티브 구성에서 여러 가용 영역을 사용합니다.

3개의 가용 영역에 배포된 다중 계층 아키텍처를 보여주는 다이어그램. Amazon S3 및 Amazon DynamoDB는 항상 자동으로 다중 AZ에 유지됩니다. ELB 또한 는 세 영역 모두에 배포됩니다.

그림 9: 3개의 가용 영역에 배포된 다중 계층 아키텍처. Amazon S3 및 Amazon DynamoDB는 항상 자동으로 다중 AZ에 유지됩니다. ELB 또한 는 세 영역 모두에 배포됩니다.

AWS 컨트롤 플레인은 일반적으로 전체 리전(여러 가용 영역) 내에서 리소스를 관리하는 기능을 제공하지만, 특정 컨트롤 플레인(Amazon EC2 및 Amazon 포함EBS)은 결과를 단일 가용 영역으로 필터링할 수 있습니다. 이처럼 결과가 필터링되면 요청은 지정된 가용 영역에서만 처리되므로 다른 가용 영역이 중단될 가능성이 낮아집니다. 이 AWS CLI 예제는 us-east-2c 가용 영역에서만 Amazon EC2 인스턴스 정보를 가져오는 방법을 보여줍니다.

AWS ec2 describe-instances --filters Name=availability-zone,Values=us-east-2c

AWS 로컬 영역

AWS 로컬 영역은 서브넷 및 EC2 인스턴스와 같은 영역 AWS 리소스의 배치 위치로 선택할 수 있다는 점 AWS 리전 에서 해당 내의 가용 영역과 비슷하게 작동합니다. 이러한 가 특별한 이유는 연결된 에 있지 않고 현재 AWS 리전 존재하지 않는 대규모 인구, 산업 및 IT 센터에 AWS 리전가깝다는 것입니다. 그럼에도 불구하고 로컬 영역의 로컬 워크로드와 AWS 리전에서 실행 중인 워크로드 간에는 고대역폭의 안전한 연결이 유지됩니다. 지연 시간이 짧아야 하는 요구 사항을 충족하기 위해 사용자에게 더 가까운 위치에 워크로드를 배포하려면 AWS 로컬 영역을 사용해야 합니다.

Amazon 글로벌 엣지 네트워크

Amazon 글로벌 엣지 네트워크는 전 세계 도시의 엣지 로케이션으로 구성됩니다. Amazon은 이 네트워크를 CloudFront 사용하여 지연 시간이 짧은 최종 사용자에게 콘텐츠를 제공합니다. AWS Global Accelerator를 사용하면 이러한 엣지 위치에 워크로드 엔드포인트를 생성하여 사용자와 가까운 AWS 글로벌 네트워크에 온보딩을 제공할 수 있습니다. Amazon API Gateway는 CloudFront 배포를 사용하여 엣지 최적화 API 엔드포인트를 허용하여 가장 가까운 엣지 위치를 통해 클라이언트 액세스를 용이하게 합니다.

AWS 리전

AWS 리전 는 자율적으로 설계되었으므로 다중 리전 접근 방식을 사용하기 위해 각 리전에 전용 서비스 사본을 배포합니다.

다중 리전 접근법은 일회성의 대규모 이벤트가 발생할 때 복구 목표를 달성하기 위한 재해 복구 전략에 자주 사용됩니다. 이러한 전략에 대한 자세한 내용은 재해 복구(DR) 계획을 참조하세요. 그러나 여기에서는 시간 경과에 따라 평균 가동 시간 목표를 달성하는 가용성에 초점을 맞춥니다. 고가용성 목표를 위해 다중 리전 아키텍처가 일반적으로 액티브/액티브로 설계됩니다. 이때 각 서비스 복사본은 각각의 리전에서 활성 상태(요청을 지원함)입니다.

권장 사항

단일 AWS 리전안에서 다중 AZ 전략을 사용하여 워크로드에 대한 대부분의 가용성 목표를 충족할 수 있습니다. 워크로드에서 가용성 요구 사항이 매우 높은 경우 또는 다중 리전 아키텍처를 요구하는 다른 비즈니스 목표가 있는 경우에만 다중 리전 아키텍처를 고려합니다.

AWS 는 리전 간 서비스를 운영할 수 있는 기능을 제공합니다. 예를 들어 Amazon Simple Storage Service(Amazon S3) 복제, Amazon RDS 읽기 전용 복제본(Aurora 읽기 전용 복제본 포함) 및 Amazon DynamoDB 글로벌 테이블을 사용하여 데이터의 연속적이고 비동기적인 데이터 복제를 AWS 제공합니다. 지속적인 복제를 통해 각 액티브 리전에서 거의 즉각적으로 데이터의 버전을 사용할 수 있습니다.

를 사용하면 인프라를 정의하고 AWS 계정 전체 및 전체에 일관되게 배포할 AWS CloudFormation수 있습니다 AWS 리전. 또한 단일 작업으로 여러 계정 및 리전에서 AWS CloudFormation 스택을 생성, 업데이트 또는 삭제할 수 있도록 하여 이 기능을 AWS CloudFormation StackSets 확장합니다. Amazon EC2 인스턴스 배포의 경우 AMI (Amazon Machine Image)를 사용하여 하드웨어 구성 및 설치된 소프트웨어와 같은 정보를 제공합니다. 필요한 를 생성하는 Amazon EC2 Image Builder 파이프라인AMIs을 구현하고 이를 활성 리전에 복사할 수 있습니다. 이렇게 하면 이러한 GoldenAMIs이 각 새 리전에서 워크로드를 배포하고 스케일 아웃하는 데 필요한 모든 것을 확보할 수 있습니다.

트래픽을 라우팅하기 위해 Amazon Route 53과 AWS Global Accelerator는 활성 리전 엔드포인트로 이동할 사용자를 결정하는 정책의 정의를 허용합니다. Global Accelerator를 사용하면 트래픽 다이얼을 설정하여 각 애플리케이션 엔드포인트로 이동하는 트래픽의 비율을 제어할 수 있습니다. Route 53은 이 비율 접근 방식과 함께 지리 근접 및 지연 시간 기반 접근 방식 등 다른 사용 가능한 정책을 지원합니다. Global Accelerator는 AWS 엣지 서버의 광범위한 네트워크를 자동으로 활용하여 가능한 한 빨리 AWS 네트워크 백본에 트래픽을 온보딩하여 요청 지연 시간을 줄입니다.

이러한 모든 기능은 각 리전의 자율성을 유지하기 위해 작동합니다. AWS Identity and Access Management (IAM) 서비스에 대한 제어 영역과 함께 글로벌 엣지 전송을 제공하는 서비스(예: Amazon CloudFront 및 Amazon Route 53)를 포함하여 이 접근 방식에 대한 예외는 거의 없습니다. 대부분의 서비스는 전적으로 단일 리전 내에서 작동합니다.

온프레미스 데이터 센터

온프레미스 데이터 센터에서 실행되는 워크로드의 경우 가능한 경우 하이브리드 환경을 설계합니다. 는 온프레미스에서 둘 다 실행할 AWS 수 있도록 전용 네트워크 연결을 AWS Direct Connect 제공합니다.

또 다른 옵션은 를 사용하여 온프레미스에서 AWS 인프라 및 서비스를 실행하는 것입니다 AWS Outposts. 는 AWS 인프라, AWS 서비스, APIs및 도구를 데이터 센터로 확장하는 AWS Outposts 완전 관리형 서비스입니다. 에 AWS 클라우드 사용된 것과 동일한 하드웨어 인프라가 데이터 센터에 설치 AWS Outposts 됩니다. 그런 다음 가장 가까운 에 연결됩니다 AWS 리전. 그런 다음 AWS Outposts 를 사용하여 지연 시간 또는 로컬 데이터 처리 요구 사항이 낮은 워크로드를 지원할 수 있습니다.

이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 높음

구현 가이드

  • 여러 가용 영역 및 를 사용합니다 AWS 리전. 워크로드 데이터와 리소스를 여러 가용 영역에 분산하거나 필요한 경우 AWS 리전전체에 분산합니다. 필요에 따라 이러한 위치는 다양할 수 있습니다.

  • 워크로드를 여러 리전에 배포해야 하는 경우 다중 리전 전략을 선택합니다. 대부분의 신뢰성 요구 사항은 다중 가용성 영역 전략을 AWS 리전 사용하여 단일 내에서 충족될 수 있습니다. 비즈니스 요구 사항을 충족하는 데 필요한 경우 다중 리전 전략을 사용합니다.

  • 워크로드 AWS Outposts 를 평가합니다. 온프레미스 데이터 센터에 대한 지연 시간이 짧아야 하거나 로컬 데이터 처리 요구 사항을 충족해야 하는 워크로드의 경우 그런 다음 를 사용하여 온프레미스에서 AWS 인프라 및 서비스를 실행합니다. AWS Outposts

  • AWS Local Zones가 사용자에게 서비스를 제공하는 데 도움이 되는지 확인합니다. 지연 시간이 짧은 요구 사항이 있는 경우 AWS 로컬 영역이 사용자 근처에 있는지 확인하세요. 그렇다면 이를 사용하여 해당 사용자에게 더 가까운 위치에 워크로드를 배포합니다.

리소스

관련 문서:

관련 비디오: