PERF04-BP06 네트워크 요구 사항에 따라 워크로드의 위치 선택
리소스 배치 옵션을 평가하여 네트워크 지연 시간을 줄이고 처리량을 향상시켜 페이지 로드 및 데이터 전송 시간을 줄임으로써 최적의 사용자 경험을 제공합니다.
일반적인 안티 패턴:
-
모든 워크로드 리소스를 하나의 지리적 위치로 통합합니다.
-
워크로드 최종 사용자가 아니라 본인과 가장 가까운 리전을 선택했습니다.
이 모범 사례 확립의 이점: 사용자 경험은 사용자와 애플리케이션 간의 지연 시간에 크게 영향을 받습니다. 적절한 AWS 리전 및 AWS 프라이빗 글로벌 네트워크를 사용하면 대기 시간을 줄이고 원격 사용자에게 더 나은 경험을 제공할 수 있습니다.
이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 중간
구현 가이드
Amazon EC2 인스턴스와 같은 리소스는 AWS 리전
Amazon EC2에서는 네트워킹용 배치 그룹을 제공합니다. 배치 그룹은 지연 시간을 줄이기 위한 인스턴스의 논리적 그룹입니다. 지원되는 인스턴스 유형이 포함된 배치 그룹과 Elastic Network Adapter(ENA)를 사용하면 지연 시간이 짧고 지터가 감소된 25Gbps 네트워크에 워크로드를 연결할 수 있습니다. 네트워크 지연 시간이 짧거나 처리량이 높은 경우 또는 두 조건을 모두 충족하는 경우 성능이 개선되는 워크로드에는 배치 그룹을 사용하는 것이 좋습니다.
지연 시간에 민감한 서비스는 Amazon CloudFront
지연 시간을 줄이고 콘텐츠 캐싱을 활성화하려면 엣지 서비스를 사용합니다. 이러한 방식의 이점을 최대한 활용하려면 DNS 및 HTTP/HTTPS용으로 캐시 제어를 올바르게 구성하세요.
구현 단계
-
네트워크 인터페이스를 오가는 IP 트래픽에 대한 정보를 캡처합니다.
-
워크로드의 네트워크 액세스 패턴을 분석하여 사용자가 애플리케이션을 사용하는 방법을 식별합니다.
-
Amazon CloudWatch
및 AWS CloudTrail 과 같은 모니터링 도구를 사용하여 네트워크 활동에 대한 데이터를 수집합니다. -
데이터를 분석하여 네트워크 액세스 패턴을 식별합니다.
-
-
다음과 같은 주요 요소를 토대로 하여 워크로드 배포용 리전을 선택합니다.
-
데이터 위치: 데이터를 많이 사용하는 애플리케이션의 경우(예: 빅 데이터 및 기계 학습) 애플리케이션 코드는 최대한 데이터와 가까운 위치에서 실행되어야 합니다.
-
사용자 위치: 사용자가 직접 사용하는 애플리케이션의 경우 워크로드의 사용자와 가까운 하나 이상의 리전을 선택합니다.
-
기타 제약 조건: What to Consider when Selecting a Region for your Workloads
에 나와 있는 비용 및 규정 준수 등 제약 요건을 고려합니다.
-
-
AWS 로컬 영역
을 사용하여 비디오 렌더링과 같은 워크로드를 실행합니다. 로컬 영역에서는 최종 사용자와 가까운 위치에 컴퓨팅 및 스토리지 리소스를 배치함으로써 이점을 얻을 수 있습니다. -
온프레미스에 남아 있어야 하는 워크로드 및 해당 워크로드를 AWS의 나머지 워크로드와 함께 원활하게 실행하려는 워크로드에 대해서는 AWS Outposts
를 사용합니다. -
고해상도 라이브 비디오 스트리밍, 고음질 오디오 및 증강 현실 또는 가상 현실(AR/VR)과 같은 5G 디바이스용 애플리케이션은 지연 시간이 매우 짧아야 합니다. 이러한 애플리케이션에서는 AWS Wavelength
를 고려합니다. AWS Wavelength에서는 5G 네트워크 내에 AWS 컴퓨팅 및 스토리지 서비스를 포함하여 지연 시간이 짧은 애플리케이션을 개발, 배포 및 확장하기 위한 모바일 엣지 컴퓨팅 인프라를 제공합니다. -
자주 사용하는 자산에 로컬 캐싱 또는 AWS Caching Solutions
를 사용하여 성능을 개선하고, 데이터 이동을 줄이며, 환경에 미치는 영향을 줄입니다. Service 사용해야 하는 경우 이미지, 스크립트, 동영상 등의 정적 콘텐츠와 API 응답 또는 웹 애플리케이션 등의 동적 콘텐츠를 캐시하는 데 사용합니다.
웹 애플리케이션의 콘텐츠를 캐시하는 데 사용합니다.
DynamoDB 테이블에 인 메모리 가속화를 추가하는 데 사용합니다.
-
워크로드 사용자에게 더 가까운 위치에서 코드를 실행할 수 있는 서비스를 사용합니다.
Service 사용해야 하는 경우 객체가 캐시에 없는 경우 시작되는 컴퓨팅 집약적 작업에 사용합니다.
HTTP(s) 요청 또는 응답 조작 등과 같이 단기 기능으로 실행할 수 있는 간단한 사용 사례에 사용합니다.
커넥티드 디바이스를 위한 로컬 컴퓨팅, 메시징 및 데이터 캐시를 실행하는 데 사용합니다.
-
일부 애플리케이션은 첫 번째 바이트까지의 지연 시간과 지터를 줄이고 처리량을 늘려 고정 진입 지점 또는 그 이상의 성능이 필요합니다. 이러한 애플리케이션은 엣지 로케이션에서 정적 애니캐스트 IP 주소 및 TCP 종료를 제공하는 네트워킹 서비스를 활용할 수 있습니다. AWS Global Accelerator
는 애플리케이션의 성능을 최대 60%까지 향상시키고 다중 리전 아키텍처에 빠른 장애 조치를 제공합니다. AWS Global Accelerator에서는 하나 이상의 AWS 리전에 호스팅되는 애플리케이션의 고정 진입 지점으로 사용되는 정적 애니캐스트 IP 주소를 제공합니다. 이 IP 주소를 사용하면 가능한 한 사용자와 가까운 AWS 글로벌 네트워크으로 트래픽이 유입될 수 있습니다. AWS Global Accelerator는 클라이언트와 가장 가까운 AWS 엣지 로케이션 간에 TCP 연결을 설정하여 초기 연결 설정 시간을 줄입니다. AWS Global Accelerator의 사용을 검토하여 TCP/UDP 워크로드의 성능을 향상시키고 다중 리전 아키텍처에 빠른 장애 조치를 제공합니다.
리소스
관련 모범 사례:
관련 문서:
관련 비디오:
-
AWS re:Invent 2023 - A migration strategy for edge and on-premises workloads
-
AWS re:Invent 2021 - AWS Outposts: Bringing the AWS experience on premises
-
AWS re:Invent 2020: AWS Wavelength: Run apps with ultra-low latency at 5G edge
-
AWS re:Invent 2022 - AWS Local Zones: Building applications for a distributed edge
-
AWS re:Invent 2021 - Building low-latency websites with Amazon CloudFront
-
AWS re:Invent 2022 - Improve performance and availability with AWS Global Accelerator
-
AWS re:Invent 2022 - Build your global wide area network using AWS
-
AWS re:Invent 2020: Global traffic management with Amazon Route 53
관련 예제: