AWS Systems Manager OpsCenter - AWS Systems Manager

AWS Systems Manager OpsCenter

AWS Systems Manager의 기능인 OpsCenter는 운영 엔지니어 및 IT 전문가가 AWS 리소스와 관련된 운영 작업 항목(OpsItems)을 보고, 조사하고, 해결할 수 있는 중앙 위치를 제공합니다. OpsCenter는 AWS 리소스에 영향을 미치는 문제의 평균 해결 시간을 단축하도록 설계되었습니다. 이 Systems Manager는 각 OpsItem, 관련 OpsItems 및 관련 리소스에 대한 컨텍스트 조사 데이터를 제공하면서 서비스 전반에 걸쳐 OpsItems를 집계하고 표준화합니다. 또한 OpsCenter는 신속하게 문제를 해결하는 데 사용할 수 있는 Systems Manager Automation 실행서를 제공합니다. 각 OpsItem에 대해 검색 가능한 사용자 지정 데이터를 지정할 수 있습니다. 상태 및 소스별로 OpsItems에 대한 자동 생성 요약 보고서를 볼 수도 있습니다. OpsCenter를 시작하려면 Systems Manager 콘솔을 엽니다. 탐색 창에서 OpsCenter를 선택합니다.

OpsCenter는 Amazon EventBridge 및 Amazon CloudWatch와 통합됩니다. 즉, CloudWatch 경보가 ALARM 상태가 되거나 EventBridge가 이벤트를 게시하는 AWS 서비스의 이벤트를 처리할 때 OpsCenter에 OpsItem을(를) 자동으로 생성하도록 이러한 서비스를 구성할 수 있습니다. OpsItems를 자동으로 생성하도록 CloudWatch 경보와 EventBridge 이벤트를 구성하면 단일 콘솔에서 AWS 리소스와 관련된 문제를 신속하게 진단하고 해결할 수 있습니다.

문제 진단을 돕기 위해 각 OpsItem에는 OpsItem을 생성한 AWS 리소스의 이름과 ID, 경보 또는 이벤트 세부 정보, 경보 기록, 경보 타임라인 그래프와 같은 상황에 맞는 관련 정보가 포함되어 있습니다.

AWS 리소스의 경우 OpsCenter는 AWS Config, AWS CloudTrail 로그 및 Amazon CloudWatch Events에서 정보를 집계하므로 조사 중에 여러 콘솔 페이지를 탐색할 필요가 없습니다.

다음 목록에는 고객이 OpsItems를 생성하는 CloudWatch 경보를 구성하는 AWS 리소스 및 지표의 유형이 포함되어 있습니다.

  • Amazon DynamoDB: 데이터베이스 읽기 및 쓰기 작업이 임계값에 도달함

  • Amazon EC2: CPU 사용률이 임계값에 도달함

  • AWS 결제: 예상 요금이 임계값에 도달함

  • Amazon EC2: 인스턴스 상태 확인 실패

  • Amazon Elastic Block Store(EBS): 디스크 공간 사용률이 임계값에 도달함

다음 목록에는 OpsItems를 생성하기 위해 고객이 구성하는 EventBridge 규칙의 유형이 포함되어 있습니다.

  • AWS Security Hub: 보안 알림 발령

  • DynamoDB: 제한 이벤트

  • Amazon EC2 Auto Scaling: 인스턴스 시작 실패

  • Systems Manager: 자동화 실행 실패

  • AWS Health: 예약된 유지 관리에 대한 알림

  • EC2: Running에서 Stopped로 인스턴스 상태 변경

또한 OpsCenter는 .NET 및 SQL Server용 Amazon CloudWatch Application Insights와 통합됩니다. 즉 애플리케이션에서 감지된 문제에 대한 OpsItems를 자동으로 생성할 수 있습니다. 또한 OpsCenter를 AWS Security Hub와 통합하여 Systems Manager에서 보안, 성능 및 운영 문제를 집계하고 조치를 취할 수 있습니다.

운영 엔지니어와 IT 전문가는 AWS Systems Manager 콘솔의 OpsCenter 페이지, 퍼블릭 API 작업, AWS Command Line Interface(AWS CLI), AWS Tools for Windows PowerShell 또는 AWS SDK를 사용하여 OpsItems를 생성하고 보고 편집할 수 있습니다. OpsCenter 퍼블릭 API 운영을 통해 OpsCenter를 사례 관리 시스템 및 상태 대시보드와 통합할 수도 있습니다.

OpsCenter 통합

다음 표에서는 OpsCenter이(가) 다른 AWS 서비스 및 Systems Manager 기능과 통합되는 방법을 설명합니다. 이러한 서비스 및 기능과 통합되면 OpsCenter를 사용하여 단일 콘솔에서 AWS 리소스와 관련된 문제를 신속하게 진단하고 해결할 수 있습니다.

서비스 또는 기능 세부 정보 자세한 정보

EventBridge

시스템이 이벤트를 게시하는 AWS 서비스의 이벤트를 처리할 때 OpsCenter에 OpsItem을(를) 자동으로 생성하도록 Amazon EventBridge를 구성할 수 있습니다. 다음 목록에는 OpsItems를 생성하기 위해 구성할 수 있는 EventBridge 규칙의 유형이 포함되어 있습니다.

  • AWS Security Hub: 보안 알림 발령

  • Amazon DynamoDB: 제한 이벤트

  • Amazon EC2 Auto Scaling: 인스턴스 시작 실패

  • Systems Manager: 자동화 실행 실패

  • AWS Health: 예약된 유지 관리에 대한 알림

  • Amazon Elastic Compute Cloud(Amazon EC2): 인스턴스 상태가 Running에서 Stopped로 변경됨

문제를 진단하는 데 도움이 되도록 각 OpsItem에는 OpsItem을 생성한 AWS 리소스의 이름과 ID, 이벤트에 대한 세부 정보와 같이 이벤트에 대한 컨텍스트 관련 정보가 포함되어 있습니다.

특정 이벤트에 대해 자동으로 OpsItems를 생성하도록 EventBridge 구성

CloudWatch

CloudWatch 경보가 ALARM 상태가 되면 OpsCenter에 OpsItem이 자동으로 생성되도록 Amazon CloudWatch를 구성할 수 있습니다. 다음 목록에는 OpsItems를 생성하도록 CloudWatch 경보를 구성할 수 있는 AWS 리소스 및 지표의 유형이 포함되어 있습니다.

  • DynamoDB: 데이터베이스 읽기 및 쓰기 작업이 임계값에 도달함

  • Amazon EC2: CPU 사용률이 임계값에 도달함

  • AWS Billing and Cost Management: 예상 요금이 임계값에 도달함

  • Amazon EC2: 인스턴스 상태 확인 실패

  • Amazon Elastic Block Store(Amazon EBS): 디스크 공간 사용량이 임계값에 도달함

문제 진단을 돕기 위해 각 OpsItem에는 OpsItem을 생성한 AWS 리소스의 이름과 ID, 경보 세부 정보, 경보 기록, 경보 타임라인 그래프와 같은 경보에 대한 상황에 맞는 관련 정보가 포함되어 있습니다.

경보에서 OpsItems를 생성하도록 CloudWatch 구성

Incident Manager

Systems Manager의 기능인 AWS Incident Manager는 AWS 호스팅 애플리케이션에 영향을 주는 인시던트를 완화하고 복구하는 데 사용할 수 있는 인시던트 관리 콘솔을 제공합니다. 인시던트는 서비스 품질의 계획되지 않은 중단 또는 감소입니다. Incident Manager를 설정 및 구성한 후 Incident Manager에서 인시던트가 생성되면 시스템은 자동으로 OpsCenter에 OpsItems를 생성합니다. OpsItem에 인시던트를 수동으로 추가할 수도 있습니다.

인시던트가 해결된 후 인시던트 사후 분석은 인시던트 대응에 대한 개선 사항을 식별하고 발견 사항을 해결하기 위한 작업 항목을 권장하는 과정을 안내합니다. 인시던트와 같이 심각도가 높은 운영 문제의 경우 OpsCenter에 OpsItem을 생성하면 운영자에게 인시던트, 분석 및 작업 항목의 전체 뷰가 제공됩니다. 이 포괄적인 뷰는 해결 시간을 단축하고 향후 유사한 문제를 완화하는 데 도움이 됩니다.

OpsCenter에서 Incident Manager 인시던트 작업

AWS Systems Manager Incident Manager 사용 설명서

.NET 및 SQL Server용 CloudWatch Application Insights

또한 OpsCenter는 .NET 및 SQL Server용 CloudWatch Application Insights와 통합됩니다. CloudWatch Application Insights를 사용하면 다른 애플리케이션 리소스와 함께 Amazon EC2 인스턴스를 사용하는 애플리케이션을 모니터링할 수 있습니다. 이 기능은 애플리케이션 리소스와 기술 스택 전반에 걸쳐 주요 지표, 로그 및 경보를 식별하고 설정합니다. 또한 이 기능은 발견된 문제에 대한 자동화된 대시보드를 생성합니다. 대시보드에는 상관된 지표 이상 징후, 로그 오류 및 오류의 근본 원인을 파악하는 데 도움이 되는 기타 정보가 포함됩니다. CloudWatch Application Insights에서 애플리케이션 리소스를 구성할 때 문제가 감지되면 시스템이 OpsCenter에 OpsItems를 생성하도록 선택할 수 있습니다.

Amazon CloudWatch User GuideSetting Up Your Application

자동으로 OpsItem을 생성하는 AWS 리소스 각각에 대해 OpsCenter는 AWS Config, AWS CloudTrail 로그 및 EventBridge의 정보를 집계합니다. 따라서 조사하는 동안 여러 콘솔 페이지를 탐색할 필요가 없습니다.

OpsCenter가 조직에 주는 이점은 무엇인가요?

OpsCenter는 AWS 리소스와 관련된 문제를 보고, 작업하고, 해결하는 데 필요한 표준 및 통합된 환경을 제공합니다. 표준 및 통합 환경을 통해 문제를 해결하고 관련 문제를 조사하며 새로운 운영 엔지니어 및 IT 전문가를 양성하는 데 소요되는 시간을 단축할 수 있습니다. 표준 및 통합 환경을 통해 문제를 관리 및 해결하는 시스템에 입력되는 수동 오류 수를 줄일 수 있습니다.

구체적으로, OpsCenter는 운영 엔지니어 및 조직에 다음과 같은 이점을 제공합니다.

  • 더 이상 AWS 리소스와 관련된 OpsItems를 보고, 조사하고, 해결하기 위해 여러 콘솔 페이지를 탐색할 필요가 없습니다. OpsItems는 중앙 위치에서 전체 서비스에 대해 집계됩니다.

  • CloudWatch 경보, EventBridge 이벤트 및 .NET 및 SQL Server용 CloudWatch Application Insights에 의해 자동 생성되는 OpsItems에 대한 서비스별 데이터 및 문맥 관련 데이터를 볼 수 있습니다.

  • OpsItem과 관련된 리소스의 Amazon 리소스 이름(ARN)을 지정할 수 있습니다. 관련 리소스를 지정함으로써 OpsCenter는 기본 제공된 로직을 사용하여 중복된 OpsItems 생성을 방지합니다.

  • 유사한 OpsItems에 대한 세부 정보와 해결 정보를 볼 수 있습니다.

  • Systems Manager Automation 실행서에 대한 정보를 신속하게 보고 실행하여 문제를 해결할 수 있습니다.

OpsCenter에는 어떤 기능이 있나요?

  • 자동 및 수동 OpsItem 생성

    OpsCenter는 Amazon CloudWatch와 통합되어 있습니다. 즉, 경보가 ALARM 상태가 되거나 Amazon EventBridge가 이벤트를 게시하는 AWS 서비스의 이벤트를 처리할 때 OpsCenter에 OpsItem을(를) 자동으로 생성하도록 CloudWatch를 구성할 수 있습니다. OpsItems를 수동으로 생성할 수도 있습니다.

    또한 OpsCenter는 .NET 및 SQL Server용 Amazon CloudWatch Application Insights와 통합됩니다. 즉 애플리케이션에서 감지된 문제에 대한 OpsItems를 자동으로 생성할 수 있습니다.

  • 세부적이고 검색 가능한 OpsItems

    각 OpsItem에는 제목, ID, 우선순위, 설명, OpsItem의 소스 및 마지막으로 업데이트된 날짜/시간을 포함하여 여러 정보 필드가 있습니다. 또한 각 OpsItem에는 다음과 같은 구성 가능한 기능이 포함되어 있습니다.

    • 상태: Open(미결), 진행 중, 해결됨, Open and In progress(미결 및 진행 중)입니다.

    • 관련 리소스: 관련 리소스는 영향을 받은 리소스 또는 OpsItem을 생성한 EventBridge 이벤트를 시작한 리소스입니다. 각 OpsItem에는 관련 리소스 섹션이 포함되어 있습니다. OpsCenter는 이 섹션에 관련 리소스의 Amazon 리소스 이름(ARN)을 자동으로 나열합니다. 또한 관련 리소스의 ARN을 수동으로 지정할 수도 있습니다. 일부 ARN 유형의 경우 OpsCenter는 해당 정보를 보기 위해 다른 콘솔 페이지를 방문할 필요가 없도록 리소스에 대한 세부 정보를 표시하는 딥 링크를 자동으로 생성합니다. 예를 들어 EC2 인스턴스의 ARN을 지정하면 EC2에서 OpsCenter의 해당 인스턴스에 대해 제공한 모든 세부 정보를 볼 수 있습니다. 관련 추가 리소스의 ARN을 수동으로 추가할 수 있습니다. 각 OpsItem은 최대 100개의 관련 리소스 ARN을 나열할 수 있습니다. 자세한 정보는 관련 리소스 작업을 참조하십시오.

    • 관련된 및 유사한 OpsItems: [관련된 OpsItems(Related OpsItems)] 기능을 사용하면 현재 OpsItem과 관련된 방식으로 OpsItems의 ID를 지정할 수 있습니다. [유사한 OpsItem(Similar OpsItem)] 기능은 OpsItem 제목과 설명을 자동으로 검토한 다음 사용자와 관련이 있거나 관심이 있을 만한 다른 OpsItems 목록을 표시합니다.

    • 검색 가능한 프라이빗 운영 데이터: 운영 데이터는 OpsItem에 대한 유용한 참조 정보를 제공하는 사용자 지정 데이터입니다. 예를 들어 로그 파일, 오류 문자열, 라이선스 키, 문제 해결 팁 또는 기타 관련 데이터를 지정할 수 있습니다. 운영 데이터를 키-값 페어로 입력합니다. 키의 최대 길이는 128자입니다. 값의 최대 크기는 20KB입니다.

      이 사용자 지정 데이터는 검색 가능하지만 제한이 있습니다. [검색 가능한 운영 데이터(Searchable operational data)] 기능의 경우 [OpsItem 개요(OpsItem Overview)] 페이지(DescribeOpsItems API 작업에서 제공)에 액세스할 수 있는 모든 사용자가 지정된 데이터를 보고 검색할 수 있습니다. [프라이빗 운영 데이터(Private operational data)] 기능의 경우 데이터는 OpsItem(GetOpsItem API 작업에서 제공)에 액세스할 수 있는 사용자만 볼 수 있습니다.

    • 중복 제거: OpsCenter는 관련 리소스를 지정하여 기본 제공 논리로 중복 OpsItems 생성을 방지합니다. OpsCenter에는 중복 OpsItems에 대한 정보를 표시하는 Operational insights라는 기능도 포함되어 있습니다. 계정의 중복 OpsItems 수를 추가로 제한하기 위해 EventBridge 이벤트 규칙에 대한 중복 제거 문자열을 수동으로 지정할 수 있습니다. 자세한 정보는 중복 OpsItems 제거을 참조하십시오.

  • OpsItems 대량 편집: OpsCenter에서 여러 OpsItems를 선택하고 상태(Status), 우선순위(Priority), 심각도(Severity), 범주(Category) 필드 중 하나를 편집할 수 있습니다.

  • 실행서를 사용하여 쉽게 문제 해결

    각 OpsItem의 [실행서(Runbooks)] 섹션에는 AWS 리소스의 일반적인 문제를 자동으로 해결하는 데 사용할 수 있는 Systems Manager Automation 실행서 목록이 있습니다. OpsItem을 열고 해당 OpsItem에 대한 AWS 리소스를 선택한 다음 콘솔에서 [자동화 실행(Run automation)] 버튼을 선택하면 OpsCenter가 OpsItem을 생성한 AWS 리소스에서 실행할 수 있는 Automation 실행서 목록을 제공합니다. OpsItem에서 Automation 실행서를 실행한 후에는 나중에 참조할 수 있도록 실행서가 OpsItem의 관련 리소스와 자동으로 연결됩니다. 또한 OpsCenter를 사용하여 EventBridge에서OpsItem 규칙을 자동으로 설정하는 경우 EventBridge는 일반적인 이벤트에 대해 실행서를 자동으로 연결합니다. OpsCenter는 특정 OpsItem에 대해 실행된 Automation 실행서의 30일 레코드를 유지합니다. 자세한 정보는 Systems Manager Automation을 사용하여 OpsItem 문제 해결을 참조하십시오.

  • 변경 알림: Amazon Simple Notification Service(SNS) 주제의 ARN을 지정하여 OpsItem이 변경되거나 편집될 때마다 알림을 게시할 수 있습니다. SNS 주제는 OpsItem과 동일한 AWS 리전에 있어야 합니다.

  • 포괄적인 OpsItem 검색 기능: OpsCenter는 OpsItems를 빠르게 찾을 수 있도록 여러 가지 검색 옵션을 제공합니다. 예를 들어 OpsItem ID, 제목, 마지막으로 수정한 시간, 운영 데이터 값, 소스 및 실행서 실행의 Automation ID 등이 있습니다. 상태 필터를 사용하여 검색 결과를 더 제한할 수 있습니다.

  • OpsItem 요약 보고서

    OpsCenter에는 다음 섹션이 자동으로 표시되는 요약 보고서 페이지가 있습니다.

    • Status summary(상태 요약): 상태(Open(미결), 진행 중, 해결됨, Open and In progress(미결 및 진행 중))별 OpsItems 요약

    • 미결 OpsItems이(가) 가장 많은 소스: 미결 OpsItems이(가) 있는 상위 AWS 서비스에 대한 분석입니다.

    • OpsItems by source and age(소스 및 기간별 OpsItems): 소스 및 생성 후 기간(일)에 따라 그룹화된 OpsItems 수

    OpsCenter 요약 보고서 보기에 대한 자세한 내용은 OpsCenter 요약 보고서 보기 섹션을 참조하세요.

  • IAM 액세스 제어

    AWS Identity and Access Management(IAM) 정책을 사용하여 OpsItems를 생성, 표시, 나열 및 업데이트할 수 있는 조직의 멤버를 제어할 수 있습니다. OpsItems에 태그를 할당한 다음 태그를 기반으로 사용자 및 그룹에 대한 액세스 권한을 부여하는 IAM 정책을 만들 수도 있습니다. 자세한 정보는 OpsCenter 시작하기을 참조하십시오.

  • 로깅 및 감사 기능 지원

    다른 AWS 서비스와(과)의 통합을 통해 AWS 계정에서 OpsCenter 사용자 작업을 감사하고 로그할 수 있습니다. 자세한 정보는 OpsCenter 활동 감사 및 로깅을 참조하십시오.

  • 콘솔, CLI, PowerShell 및 SDK에서 OpsCenter 기능에 액세스

    선택한 AWS Systems Manager 콘솔, AWS Command Line Interface(AWS CLI), AWS Tools for PowerShell 또는 AWS SDK를 사용하여 OpsCenter로 작업할 수 있습니다.

OpsCenter는 Amazon EventBridge에서 어떻게 작동하나요? 어떤 서비스를 사용해야 합니까?

Amazon EventBridge는 AWS 리소스의 변경 사항을 설명하는 시스템 이벤트의 스트림을 거의 실시간으로 제공합니다. 신속하게 설정할 수 있는 단순 규칙을 사용하여 일치하는 이벤트를 검색하고 하나 이상의 대상 함수 또는 스트림으로 이를 라우팅할 수 있습니다. 일반적으로 EventBridge는 리소스에 문제가 있음을 알려줍니다.

OpsCenter를 사용하면 문제를 조사하고 해결하는 데 도움이 됩니다. OpsCenter는 엔지니어가 철저한 조사를 수행할 수 있도록 EventBridge의 데이터 또는 엔지니어가 수동으로 입력한 데이터를 가져옵니다. 또한 OpsCenter는 이러한 문제를 신속하게 해결할 수 있는 Automation 실행서를 제공합니다. OpsCenter는 성능 저하, 상태 변경, 실행 실패, 유지 관리 알림 및 보안 경보와 같은 유형의 문제를 해결하기 위해 OpsItems를 자동으로 생성할 수 있도록 하여(또는 수동으로 OpsItems를 생성할 수 있음) EventBridge와 통합됩니다.

OpsCenter는 기존의 사례 관리 시스템과 통합됩니까?

OpsCenter는 기존 사례 관리 시스템을 보완하도록 설계되었습니다. 퍼블릭 API 작업을 사용하여 OpsItems를 기존 사례 관리 시스템에 통합할 수 있습니다. 또한 현재 시스템에서 수동 수명 주기 워크플로우를 유지 관리하고 OpsCenter를 조사 및 해결 허브로 사용할 수 있습니다.

OpsCenter 퍼블릭 API 작업에 대한 자세한 내용은 AWS Systems Manager API Reference의 다음 API 작업을 참조하세요.

OpsCenter를 사용하는 데 비용이 듭니까?

예 자세한 내용은 AWS Systems Manager 요금을 참조하세요.

OpsCenter는 온프레미스 및 하이브리드 관리형 노드와 함께 작동하나요?

예 OpsCenter를 사용하여 Systems Manager용으로 구성된 온프레미스 관리형 노드의 문제를 조사하고 해결할 수 있습니다. Systems Manager에 대한 온프레미스 서버 및 가상 머신 설정과 구성에 대한 자세한 내용은 하이브리드 환경을 위한 AWS Systems Manager 설정 섹션을 참조하세요.

OpsCenter의 할당량은 얼마인가요?

Amazon Web Services General ReferenceSystems Manager Service Quotas에서 모든 Systems Manager 기능의 할당량을 볼 수 있습니다. 다르게 표시되지 않는 한, 리전별로 각 할당량이 적용됩니다.