X-Ray 인사이트 사용 - AWS X-Ray

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

X-Ray 인사이트 사용

AWS X-Ray 는 계정의 추적 데이터를 지속적으로 분석하여 애플리케이션의 긴급한 문제를 식별합니다. 결함률이 예상 범위를 초과하면 문제를 기록하고 문제가 해결될 때까지 그 영향을 추적하는 인사이트를 생성합니다. 인사이트를 통해 다음을 수행할 수 있습니다.

  • 애플리케이션에서 문제가 발생하는 위치, 문제의 근본 원인 및 관련 영향을 파악합니다. 인사이트에서 제공하는 영향 분석을 통해 이슈의 심각도와 우선순위를 도출할 수 있습니다.

  • 시간이 지남에 따라 문제가 변경될 때마다 알림을 받습니다. Amazon EventBridge를 사용하여 인사이트 알림을 모니터링 및 알림 솔루션과 통합할 수 있습니다. 이 통합 기능을 사용하면 문제의 심각도에 따라 자동화된 이메일 또는 알림을 보낼 수 있습니다.

X-Ray 콘솔은 트레이스 맵에서 진행 중인 인시던트가 있는 노드를 식별합니다. 인사이트 요약을 보려면 해당 노드를 선택하십시오. 왼쪽 탐색 창에서 인사이트를 선택하여 인사이트를 확인하고 필터링할 수도 있습니다.

인사이트 요약이 포함된 트레이스 맵 노드입니다.

X-Ray는 서비스 맵에서 하나 이상의 노드에서 이상을 감지할 때 인사이트를 제공합니다. 이 서비스는 통계적 모델링을 사용하여 애플리케이션에서 예상되는 서비스 장애율을 예측합니다. 이전 예제에서 이상은의 결함 증가입니다 AWS Elastic Beanstalk. Elastic Beanstalk 서버에서 여러 번의 API 직접 호출 시간 초과 현상이 발생하여 다운스트림 노드에 이상 징후가 발생했습니다.

X-Ray 콘솔에서 인사이트 활성화하기

인사이트 기능을 사용하려는 각 그룹에서 인사이트를 활성화해야 합니다. 그룹 페이지에서 인사이트를 활성화할 수 있습니다.

  1. X-Ray 콘솔을 엽니다.

  2. 기존 그룹을 선택하거나 그룹 생성을 선택하여 새 그룹을 만든 다음 인사이트 활성화를 선택합니다. X-Ray 콘솔에서 그룹을 구성하는 방법에 대한 자세한 내용은 그룹 구성를 참조하세요.

  3. 왼쪽의 탐색 창에서 인사이트를 선택한 다음 확인하려는 인사이트를 선택합니다.

    X-Ray 콘솔의 인사이트 목록
참고

X-Ray는 인사이트에서 데이터를 검색하기 위해 GetInsightSummaries, GetInsight, GetInsightEvents 및 GetInsightImpactGraph API 작업을 사용합니다. 인사이트를 보려면 AWSxRayReadOnlyAccess IAM 관리형 정책을 사용하거나 다음과 같은 사용자 지정 정책을 IAM 역할에 추가하십시오.

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "xray:GetInsightSummaries", "xray:GetInsight", "xray:GetInsightEvents", "xray:GetInsightImpactGraph" ], "Resource": [ "*" ] } ] }

자세한 내용은 AWS X-Ray 에서 IAM을 사용하는 방법 단원을 참조하십시오.

인사이트 알림 활성화

인사이트 알림을 사용하면 인사이트가 생성되거나, 크게 변경되거나, 종료된 시점과 같은 각 인사이트 이벤트에 대해 알림이 생성됩니다. 고객은 Amazon EventBridge 이벤트를 통해 이러한 알림을 수신할 수 있으며, 조건부 규칙을 사용하여 SNS 알림, Lambda 간접 호출, SQS 대기열에 메시지 게시 또는 EventBridge가 지원하는 모든 대상과 같은 작업을 수행할 수 있습니다. 인사이트 알림은 최선의 노력을 다해 발송되지만 반드시 발송된다는 보장은 없습니다. 대상에 대한 자세한 내용은 Amazon EventBridge 대상을 참조하세요.

그룹 페이지에서 인사이트가 활성화된 모든 그룹에 대해 인사이트 알림을 활성화할 수 있습니다.

X-Ray 그룹에 대한 알림을 활성화하려면
  1. X-Ray 콘솔을 엽니다.

  2. 기존 그룹을 선택하거나 그룹 생성을 선택하여 새 그룹을 만든 다음 인사이트 활성화가 선택되어 있는지 확인한 다음, 알림 활성화를 선택합니다. X-Ray 콘솔에서 그룹을 구성하는 방법에 대한 자세한 내용은 그룹 구성를 참조하세요.

Amazon EventBridge 조건부 규칙을 구성하려면
  1. EventBridge 콘솔을 엽니다.

  2. 왼쪽 탐색 표시줄의 규칙으로 이동하여 규칙 생성을 선택합니다.

  3. 규칙의 이름 및 설명을 입력합니다.

  4. 이벤트 패턴을 선택한 다음 사용자 지정 패턴을 선택합니다. "source": [ "aws.xray" ]"detail-type": [ "AWS X-Ray Insight Update" ]를 포함하는 패턴을 제공하십시오. 다음은 가능한 패턴의 몇 가지 예입니다.

    • X-Ray 인사이트에서 들어오는 모든 이벤트와 일치하는 이벤트 패턴:

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ] }
    • 지정된 statecategory와 일치하는 이벤트 패턴:

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ], "detail": { "State": [ "ACTIVE" ], "Category": [ "FAULT" ] } }
  5. 이벤트가 이 규칙과 일치할 때 간접 호출할 대상을 선택하고 구성합니다.

  6. (선택 사항) 이 규칙을 더 쉽게 식별하고 선택할 수 있도록 태그를 입력합니다.

  7. 생성(Create)을 선택합니다.

참고

X-Ray 인사이트 알림은 현재 고객 관리형 키를 지원하지 않는 Amazon EventBridge로 이벤트를 전송합니다. 자세한 내용은 의 데이터 보호 AWS X-Ray 단원을 참조하십시오.

인사이트 개요

인사이트 개요 페이지에서는 세 가지 주요 질문에 대한 답변을 제시합니다:

  • 근본적인 문제는 무엇인가요?

  • 근본 원인은 무엇인가요?

  • 어떤 영향이 있나요?

Anomalous Services 섹션에는 인시던트 중 결함률의 변화를 보여주는 각 서비스에 대한 타임라인이 표시됩니다. 타임라인에는 결함이 있는 추적의 개수와 기록된 트래픽 양에 따라 예상되는 결함 수를 나타내는 실선 밴드가 겹쳐져 표시됩니다. 인사이트 지속 시간은 인시던트 윈도우에 시각화되어 표시됩니다. 인시던트 윈도우는 X-Ray에서 지표가 비정상적으로 변하는 것을 관찰할 때 시작되며 인사이트가 활성화되어 있는 동안 지속됩니다.

다음 예는 인시던트를 발생시킨 결함의 증가를 보여줍니다:

X-Ray 인사이트 개요 페이지

근본 원인 섹션에는 근본 원인 서비스와 영향을 받는 경로에 초점을 맞춘 트레이스 맵이 표시됩니다. 근본 원인 맵의 오른쪽 상단에 있는 눈 아이콘을 선택하면 영향을 받지 않은 노드를 숨길 수 있습니다. 근본 원인 서비스는 X-Ray가 이상 징후를 식별한 가장 멀리 위치한 다운스트림 노드입니다. 이는 사용자가 계측한 서비스 또는 서비스가 계측된 클라이언트로 호출한 외부 서비스를 나타낼 수 있습니다. 예를 들어 계측된 AWS SDK 클라이언트를 사용하여 Amazon DynamoDB를 호출하면 DynamoDB에서 장애가 증가하면 DynamoDB를 근본 원인으로 사용하여 인사이트를 얻을 수 있습니다.

근본 원인을 자세히 조사하려면 근본 원인 그래프에서 근본 원인 세부 정보 보기를 선택하십시오. 분석 페이지를 사용하여 근본 원인 및 관련 메시지를 조사할 수 있습니다. 자세한 내용은 분석 콘솔과 상호 작용 단원을 참조하십시오.

X-Ray 인사이트 개요 페이지

맵의 업스트림에서 계속해서 발생하는 오류는 여러 노드에 영향을 미치고 여러 이상 징후를 유발할 수 있습니다. 오류가 요청을 한 사용자에게까지 전달되면클라이언트 오류가 발생하게 됩니다. 트레이스 맵의 루트 노드에 결함이 있는 경우입니다. 영향 그래프는 전체 그룹에 대한 클라이언트 경험의 타임라인을 제공합니다. 이 경험은 장애, 오류, 스로틀, 정상 상태의 백분율을 기반으로 계산됩니다.

X-Ray 인시던트에 대한 영향 그래프.

이 예는 인시던트 발생 시간 동안 루트 노드에서 결함이 발생하여 트레이스가 증가한 것을 보여줍니다. 다운스트림 서비스의 인시던트가 항상 클라이언트 오류의 증가와 일치하는 것은 아닙니다.

인사이트 분석을 선택하면 인사이트의 원인이 되는 일련의 트레이스에 대해 자세히 살펴볼 수 있는 X-Ray 분석 콘솔이 창에 열립니다. 자세한 내용은 분석 콘솔과 상호 작용 단원을 참조하십시오.

영향력 이해하기

AWS X-Ray 는 인사이트 및 알림 생성의 일환으로 진행 중인 문제로 인한 영향을 측정합니다. 영향력은 두 가지 방법으로 측정됩니다:

  • X-Ray 그룹에 미치는 영향

  • 근본 원인 서비스에 미치는 영향

이 영향력은 지정된 기간 내에 실패하거나 오류를 일으키는 요청의 비율에 따라 결정됩니다. 이 영향력 분석을 통해 특정 시나리오를 기반으로 문제의 심각도와 우선 순위를 도출할 수 있습니다. 이 영향력은 인사이트 알림 외에도 콘솔 환경의 일부로 제공됩니다.

중복 제거

AWS X-Ray 인사이트는 여러 마이크로서비스에서 문제를 중복 제거합니다. 이상 징후 탐색을 사용하여 문제의 근본 원인이 되는 서비스를 파악하고, 동일한 근본 원인으로 인해 다른 관련 서비스에서 이상 행동을 보이는지 확인하고, 그 결과를 하나의 인사이트로 기록합니다.

인사이트 진행 상황 검토

X-Ray는 인사이트가 해결될 때까지 주기적으로 재평가하고, 주목할 만한 중간 변경 사항을 알림으로 기록합니다. 알림은 Amazon EventBridge 이벤트로 전송할 수 있습니다. 이를 통해 프로세스와 워크플로를 구축하여 시간이 지남에 따라 이슈가 어떻게 변화했는지 파악하고, 이메일 전송 또는 EventBridge를 사용한 알림 시스템 통합 등의 적절한 조치를 취할 수 있습니다.

검사 페이지의 영향 타임라인에서 인시던트 이벤트를 검토할 수 있습니다. 다른 서비스를 선택할 때까지 타임라인에는 기본값으로 가장 영향을 많이 받는 서비스가 표시됩니다.

영향력 타임라인이 있는 페이지를 살펴보세요.

이벤트에 대한 트레이스 맵과 그래프를 보려면 영향 타임라인에서 해당 이벤트를 선택합니다. 트레이스 맵에는 인시던트의 영향을 받는 애플리케이션의 서비스가 표시됩니다. 영향 분석은 선택한 노드와 그룹 내 클라이언트의 장애 타임라인을 그래프로 표시합니다.

X-Ray 인사이트에 대한 영향 분석 그래프.

인시던트와 관련된 트레이스를 더 자세히 살펴보려면 검사 페이지에서 이벤트 분석을 선택하십시오. 분석 페이지를 사용하여 추적 목록을 세분화하고 영향을 받는 사용자를 식별할 수 있습니다. 자세한 내용은 분석 콘솔과 상호 작용 단원을 참조하십시오.