X-Ray Insights 사용 - AWS X-Ray

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

X-Ray Insights 사용

AWS X-Ray계정의 추적 데이터를 지속적으로 분석하여 애플리케이션의 새로운 문제를 식별합니다. 결함률이 예상 범위를 초과하면 문제를 기록하고 해결될 때까지 영향을 추적하는 인사이트를 생성합니다. 인사이트를 통해 다음을 수행할 수 있습니다.

  • 애플리케이션에서 문제가 발생하는 위치, 문제의 근본 원인 및 관련 영향을 식별하십시오. Insights에서 제공하는 영향 분석을 통해 문제의 심각도와 우선순위를 도출할 수 있습니다.

  • 시간이 지남에 따라 문제가 바뀌면 알림을 받을 수 있습니다. Insights 알림은 Amazon을 사용하여 모니터링 및 경고 솔루션과 통합할 수 EventBridge 있습니다. 이 통합을 통해 문제의 심각도에 따라 자동 이메일 또는 알림을 보낼 수 있습니다.

X-Ray 콘솔은 서비스 맵에서 진행 중인 인시던트가 있는 노드를 식별합니다. Insights 요약을 보려면 영향을 받는 노드를 선택합니다. 왼쪽의 탐색 창에서 Insights를 선택하여 인사이트를 보고 필터링할 수도 있습니다.


      인사이트 요약이 포함된 서비스 맵 노드.

X-Ray는 서비스 맵의 하나 이상의 노드에서 이상을 감지하면 통찰력을 제공합니다. 이 서비스는 통계 모델링을 사용하여 애플리케이션에서 예상되는 서비스 장애율을 예측합니다. 위 예에서 발생한 이상 현상은 의 장애 증가입니다AWS Elastic Beanstalk. Elastic Beanstalk 서버에서 여러 번의 API 호출 시간 초과가 발생하여 다운스트림 노드에 이상이 발생했습니다.

X-Ray 콘솔에서 인사이트 활성화

인사이트 기능을 사용하려는 각 그룹에 대해 인사이트가 활성화되어 있어야 합니다. 그룹 페이지에서 인사이트를 활성화할 수 있습니다.

  1. X-Ray 콘솔을 엽니다.

  2. 기존 그룹을 선택하거나 그룹 생성을 선택하여 새 그룹을 만든 다음 Insights 활성화를 선택합니다. X-Ray 콘솔에서 그룹을 구성하는 방법에 대한 자세한 내용은 섹션을 참조하세요그룹 구성.

  3. 왼쪽 탐색 창에서 Insights (왼쪽 탐색 창에서 Insights) 를 선택한 다음 보려는 Insights (왼쪽 탐색 창에서 Insights) 를 선택합니다.

    
            X-Ray 콘솔의 Insights 목록
참고

X-Ray는 GetInsightSummaries GetInsight GetInsightEvents, 및 GetInsightImpactGraph API 작업을 사용하여 인사이트에서 데이터를 검색합니다. 인사이트를 보려면 AWSXrayReadOnlyAccess IAM 관리형 정책을 사용하거나 IAM 역할에 다음과 같은 사용자 지정 정책을 추가하세요.

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "xray:GetInsightSummaries", "xray:GetInsight", "xray:GetInsightEvents", "xray:GetInsightImpactGraph" ], "Resource": [ "*" ] } ] }

자세한 내용은 AWS X-Ray에서 IAM을 사용하는 방식을 참조하세요.

Insights 알림 활성화

인사이트 알림을 사용하면 인사이트가 생성되거나, 크게 변경되거나, 종료될 때와 같은 각 인사이트 이벤트에 대해 알림이 생성됩니다. 고객은 Amazon EventBridge 이벤트를 통해 이러한 알림을 수신하고 조건부 규칙을 사용하여 SNS 알림, Lambda 호출, SQS 대기열에 메시지 게시 또는 대상 EventBridge 지원 등의 작업을 수행할 수 있습니다. Insights 알림은 최선의 작업을 기반으로 발생하지만 보장되지는 않습니다. 대상에 대한 자세한 내용은 Amazon EventBridge 대상 을 참조하세요.

그룹 페이지에서 인사이트가 활성화된 모든 그룹에 대한 인사이트 알림을 활성화할 수 있습니다.

X-Ray 그룹에 대한 알림을 활성화하려면
  1. X-Ray 콘솔을 엽니다.

  2. 기존 그룹을 선택하거나 그룹 생성을 선택하여 새 그룹을 만들고 Insights 활성화가 선택되어 있는지 확인한 다음 알림 활성화를 선택합니다. X-Ray 콘솔에서 그룹을 구성하는 방법에 대한 자세한 내용은 섹션을 참조하세요그룹 구성.

Amazon EventBridge 조건부 규칙을 구성하려면
  1. 아마존 EventBridge 콘솔을 엽니다.

  2. 왼쪽 탐색 표시줄의 규칙으로 이동한 다음 규칙 생성을 선택합니다.

  3. 규칙의 이름과 설명을 입력합니다.

  4. 이벤트 패턴을 선택한 다음 사용자 지정 패턴을 선택합니다. "source": [ "aws.xray" ]및 를 포함하는 패턴을 제공합니다"detail-type": [ "AWS X-Ray Insight Update" ]. 다음은 가능한 패턴의 예입니다.

    • X-Ray Insights에서 들어오는 모든 이벤트와 일치하는 이벤트 패턴:

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ] }
    • 지정된 이벤트state 패턴과 일치하는 이벤트 패턴category:

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ], "detail": { "State": [ "ACTIVE" ], "Category": [ "FAULT" ] } }
  5. 이벤트가 이 규칙과 일치할 때 호출할 대상을 선택하고 구성합니다.

  6. (선택 사항) 이 규칙을 보다 쉽게 식별하고 선택할 수 있도록 태그를 제공합니다.

  7. Create(생성)를 선택합니다.

참고

X-Ray Insights 알림은 현재 고객 관리 키를 지원하지 않는 EventBridge Amazon으로 이벤트를 전송합니다. 자세한 내용은 AWS X-Ray의 데이터 보호을 참조하세요.

Insights 개요

인사이트 개요 페이지에서는 다음과 같은 세 가지 주요 질문에 대한 답을 제시합니다.

  • 근본적인 문제는 무엇인가요?

  • 근본 원인은 무엇인가요?

  • 이란 무엇인가요?

변칙 서비스 섹션에는 사고 발생 시 장애 발생률의 변화를 보여주는 각 서비스의 타임라인이 표시됩니다. 타임라인에는 기록된 트래픽 양에 따라 예상 장애 수를 나타내는 솔리드 밴드 위에 오류가 있는 트레이스 수가 표시됩니다. 인사이트의 지속 시간은 인시던트 창에서 시각화됩니다. 인시던트 윈도우는 X-Ray가 지표가 변칙 상태가 되는 것을 관찰할 때 시작되고 인사이트가 활성화되는 동안 지속됩니다.

다음 예는 사고를 일으킨 결함의 증가를 보여줍니다.


        X-Ray Insights 개요 페이지

근본 원인 섹션에는 근본 원인 서비스와 영향을 받는 경로에 초점을 맞춘 서비스 맵이 표시됩니다. 근본 원인 맵의 오른쪽 상단에 있는 눈 아이콘을 선택하여 영향을 받지 않는 노드를 숨길 수 있습니다. 근본 원인 서비스는 X-Ray에서 이상 현상을 식별한 가장 먼 다운스트림 노드입니다. 사용자가 인스트루먼트한 서비스 또는 서비스에서 인스트루먼티드 클라이언트를 통해 호출한 외부 서비스를 나타낼 수 있습니다. 예를 들어, 계측된AWS SDK 클라이언트를 사용하여 Amazon DynamoDB를 호출하는 경우 DynamoDB의 장애가 증가하면 DynamoDB를 근본 원인으로 간주하는 인사이트를 얻을 수 있습니다.

근본 원인을 더 자세히 조사하려면 근본 원인 그래프에서 근본 원인 세부 정보 보기를 선택합니다. 분석 페이지를 사용하여 근본 원인 및 관련 메시지를 조사할 수 있습니다. 자세한 내용은 분석 콘솔과 상호 작용을 참조하세요.


        X-Ray Insights 개요 페이지

맵의 업스트림에서 계속되는 결함은 여러 노드에 영향을 미치고 여러 이상 현상을 일으킬 수 있습니다. 장애가 요청을 한 사용자에게 완전히 전달되면 결과는 클라이언트 오류입니다. 서비스 맵의 루트 노드에 있는 오류입니다. 영향 그래프는 전체 그룹에 대한 고객 경험의 타임라인을 제공합니다. 이 경험은 장애, 오류, 스로틀 및 정상 상태의 백분율을 기준으로 계산됩니다.


        X-Ray 사고에 대한 영향 그래프.

이 예에서는 사고 발생 시 루트 노드에 장애가 발생한 트레이스가 증가하는 것을 보여줍니다. 다운스트림 서비스의 인시던트가 항상 클라이언트 오류의 증가와 일치하는 것은 아닙니다.

인사이트 분석을 선택하면 X-Ray Analytics 콘솔이 창에서 열리고 통찰력을 유발하는 트레이스 세트를 자세히 살펴볼 수 있습니다. 자세한 내용은 분석 콘솔과 상호 작용을 참조하세요.

영향에 대한 이해

AWS X-Ray인사이트 및 알림 생성의 일환으로 진행 중인 문제로 인한 영향을 측정합니다. 영향은 두 가지 방식으로 측정됩니다.

  • X-Ray 그룹에 미치는 영향

  • 근본 원인 서비스에 미치는 영향

이 영향은 지정된 기간 내에 실패하거나 오류를 일으킨 요청의 비율에 따라 결정됩니다. 이 영향 분석을 통해 특정 시나리오를 기반으로 문제의 심각도와 우선순위를 도출할 수 있습니다. 이 영향은 인사이트 알림과 함께 콘솔 환경의 일부로 제공됩니다.

중복 제거

AWS X-Ray인사이트는 여러 마이크로서비스 전반의 중복 문제를 제거합니다. 이상 징후 탐지를 사용하여 문제의 근본 원인인 서비스를 파악하고, 다른 관련 서비스가 동일한 근본 원인으로 인해 이상 동작을 보이는지 확인하고, 결과를 단일 인사이트로 기록합니다.

인사이트 진행 상황 검토

X-Ray는 문제가 해결될 때까지 주기적으로 통찰력을 재평가하고, 주요 중간 변경 사항을 알림으로 기록하여 Amazon EventBridge 이벤트로 보낼 수 있습니다. 이를 통해 프로세스 및 워크플로를 구축하여 시간이 지남에 따라 문제가 어떻게 변했는지 확인하고 를 사용하여 이메일을 보내거나 경고 시스템과 통합하는 등의 적절한 조치를 취할 수 EventBridge 있습니다.

Inspect 페이지의 영향 타임라인에서 사고 이벤트를 검토할 수 있습니다. 기본적으로 타임라인에는 다른 서비스를 선택할 때까지 영향을 가장 많이 받는 서비스가 표시됩니다.


        임팩트 타임라인으로 페이지를 검사하세요.

이벤트에 대한 서비스 맵과 그래프를 보려면 영향 타임라인에서 선택하세요. 서비스 맵에는 인시던트의 영향을 받는 애플리케이션 서비스가 표시됩니다. 영향 분석에서 그래프는 선택한 노드와 그룹 내 클라이언트에 대한 장애 일정을 보여줍니다.


        X-Ray 통찰력을 위한 영향 분석 그래프.

인시던트와 관련된 트레이스를 더 자세히 살펴보려면 인스펙트 페이지에서 이벤트 분석을 선택하세요. Analytics 페이지를 사용하여 추적 목록을 구체화하고 영향을 받는 사용자를 식별할 수 있습니다. 자세한 내용은 분석 콘솔과 상호 작용 단원을 참조하세요.