모범 사례 11.2 - 가용성 유지를 위한 접근 방식 정의
단일 기술 구성 요소 또는 AWS 서비스의 장애를 견딜 수 있는 복원력 있는 아키텍처를 통해 가용성을 유지합니다. 이러한 메커니즘에는 이중화된 용량, 로드 밸런싱, 소프트웨어 클러스터가 포함될 수 있습니다.
제안 사항 11.2.1 – 리소스 고갈 또는 서비스 품질 저하로 인한 장애를 방지
리소스 초과 프로비저닝, 증가에 대한 사전 모니터링 및 한도 설정을 통한 사용량 제한을 조사합니다.
운영 우수성 원칙은 SAP 애플리케이션의 상태를 이해하고 적절한 조치를 취할 수 있도록 하는 다양한 방법을 다룹니다. [운영 우수성] 1 - 상태를 이해하고 대응할 수 있도록 SAP 워크로드를 설계 를 참조하세요.
성능 원칙은 용량을 적절한 규모로 설정하고 크기 조정하는 데 도움이 될 수 있습니다. [성능]: 16 - 지속적인 성능 및 최적화 옵션 이해 .
제안 사항 11.2.2 – 유지 관리 일정을 위한 전략을 수립
비즈니스에 예정된 중단을 최소화해야 하는 요구 사항이 있는 경우 SAP 애플리케이션, 데이터베이스, 운영 체제, AWS 등 모든 수준에서 유지 관리 전략을 개발해야 합니다. 다음 사항을 고려하세요.
-
프라이머리 노드와 세컨더리 노드를 교대로 사용하는 복제 및 클러스터 솔루션을 사용.
-
단계적 중단이 용이하게 확장 및 축소할 수 있는 초과 용량 및 메커니즘.
-
가능한 경우 운영 체제에 대한 라이브 패치 적용 접근 방식을 사용.
-
AWS 설명서: AWS Systems Manager 패치 관리자 패치 그룹
-
SAP Note: 1913302 - HANA: 짧은 유지 관리 작업을 위해 DB 연결 일시 중단
[SAP 포털 액세스 권한 필요] -
SAP Note: 2077934 - HA 환경의 Rolling Kernel Switch
[SAP 포털 액세스 권한 필요] -
SAP Note: 953653 - Rolling Kernel Switch
[SAP 포털 액세스 권한 필요] -
SAP Note: 2254173 - Linux: Pacemaker 기반 NetWeaver HA 환경의 Rolling Kernel Switch
[SAP 포털 액세스 권한 필요]
또한 일시적으로 성능을 향상시켜 예정된 유지 관리의 전체 가동 중지 시간을 단축할 수 있도록 AWS 서비스의 탄력적 기능을 평가해야 합니다. 예를 들어, 데이터베이스가 실행되는 Amazon EC2 인스턴스의 크기를 확장하여 업그레이드 작업에 더 많은 CPU 및 스토리지 처리량을 제공하거나 EBS 볼륨 유형을 gp2에서 io2로 전환하여 데이터베이스 재구성 중에 스토리지 처리량을 개선합니다.
제안 사항 11.2.3 – 소프트웨어 클러스터 또는 기타 메커니즘으로 SAP 단일 장애 지점을 보호
가용 영역 간에 SAP 단일 장애 지점(SAP 중앙 서비스 및 데이터베이스) 자동 장애 조치를 위해 고가용성(HA) 클러스터링 솔루션을 사용할 수 있습니다.
여러 SAP 인증 클러스터링 솔루션이
SAP 웹 사이트
단일 장애 지점에 클러스터링 솔루션을 사용하지 않기로 한 경우 서비스 복원과 관련된 오류를 최소화하기 위해 스크립팅 또는 런북을 고려합니다.
제안 사항 11.2.4 – 지원되는 구성 요소에 대한 이중화된 용량 또는 자동 크기 조정
정적, 동적 또는 예약된 용량 변경이 사용량과 일치하는지 평가합니다. 최소 용량 요구 사항과 장애 및 유지 관리가 해당 요구 사항에 미치는 영향을 검토합니다. 적절한 경우 장애 복구 시간을 확보할 수 있도록 오버 프로비저닝합니다.
AZ 장애 발생 시에도 100% 용량을 유지해야 하는 경우 3개의 AZ에 걸쳐 애플리케이션 계층을 배포하는 것을 고려해야 합니다. 이때 각 AZ는 필요한 총 용량의 50%를 가져야 합니다.
여러 AZ에 SAP 애플리케이션 서버 계층을 배포하는 것 외에도 다음 SAP on AWS 블로그 게시물에 설명된 것과 같이
Amazon EC2 Auto Scaling
-
SAP on AWS 블로그: AWS를 사용하여 SAP Application Auto Scaling 활성화
-
AWS 설명서: SAP용 Amazon EC2 인스턴스 유형
-
SAP Note: 1656099 - AWS의 SAP 애플리케이션: DB/OS 및 Amazon EC2 제품 지원
[SAP 포털 액세스 권한 필요]
제안 사항 11.2.5 – 모든 식별된 장애 시나리오에서 용량 가용성을 보장
다음은 분석을 안내하는 데 사용할 수 있는 장애 시나리오의 예입니다. 시나리오의 세분 수준 및 적용 범위, 분류, 영향은 요구 사항 및 아키텍처에 따라 달라집니다.
장애 시나리오 예 | 상대적 발생 위험 |
---|---|
계획/제어된 유지 관리 | 계획 |
리소스 고갈 또는 손상(높은 CPU 사용률/파일 시스템 가득 참/메모리 부족/스토리지 문제) | 보통 |
분산형 무상태 구성 요소 장애(예: 웹 디스패처) | 보통 |
분산형 상태 유지 구성 요소 장애(예: 애플리케이션 서버) | 보통 |
단일 장애 지점(데이터베이스/SAP 중앙 서비스) | 보통 |
AZ/네트워크 장애 | 낮음 |
핵심 서비스 장애(DNS/Amazon EFS/API 호출) | 낮음/보통 |
손상/우발적 삭제/악의적 활동/잘못된 코드 배포 | 낮음 |
리전 장애 | 매우 낮음 |
용량 예약에 대한 추가 지침은 다음에서 확인할 수 있습니다. [안정성]: 제안 사항 10.2.5 – 용량을 보장하기 위한 전략을 조사 및 AWS 백서: Architecture Guidance for Availability and Reliability of SAP on AWS(SAP on AWS의 가용성 및 안정성을 위한 아키텍처 지침) .
AWS 계정 내에서 사용 가능한 예약 인스턴스는 AWS Cost Explorer RI 보고서 를 사용하여 검토할 수 있습니다.
제안 사항 11.2.6 – 적용 가능한 경우 가용성이 내재된 AWS 서비스를 사용
여러 AWS 서비스는 설계에 가용성이 포함되며 고가용성을 위해 여러 가용 영역에서 실행됩니다. SAP 컨텍스트에서 사용되는 관련 서비스에는 다음이 포함됩니다.
-
AWS 서비스: Amazon EFS
-
AWS 서비스: Elastic Load Balancing
-
AWS 서비스: Route 53
-
AWS 서비스: AWS Transit Gateway
-
AWS 서비스: Amazon S3
또한 배스천 호스트 또는 SAPRouter와 같은 무상태 서비스를 사용하는 구성 요소는 Auto Scaling 그룹을 사용하여 고가용성을 달성할 수 있습니다.
제안 사항 11.2.7 -– 네트워크 연결을 보장하기 위한 AWS 모범 사례를 준수
사용 중인 AWS 리전에 대한 네트워크 연결의 복원력을 보장하기 위해 다음 AWS 모범 사례 중 하나 이상을 평가합니다.
-
AWS 설명서: AWS Direct Connect 복원 도구 키트
-
AWS 설명서: AWS VPN CloudHub
클러스터 솔루션이 오버레이 IP를 사용하는 경우 VPC 외부로부터 액세스를 활성화하려면 다음을 고려합니다.
-
AWS 설명서: 오버레이 IP 주소 라우팅을 사용한 SAP on AWS 고가용성