5단계: 일시 중단된 그룹 확인 - Amazon EMR

5단계: 일시 중단된 그룹 확인

노드를 시작하려고 시도하는 동안 인스턴스 그룹에 너무 많은 오류가 발생할 경우 인스턴스 그룹은 일시 중단됩니다. 예를 들어 부트스트랩 작업을 수행하는 동안 새 노드에서 반복적으로 장애가 발생하면 새 노드 프로비저닝을 계속 시도하는 대신 일정 시간 이후 인스턴스 그룹이 SUSPENDED 상태가 됩니다.

다음과 같은 경우에 노드가 실행에 실패할 수 있습니다.

  • 하둡 또는 클러스터가 어떤 식으로든 손상되었거나 클러스터에 새 노드를 허용하지 않음

  • 새 노드에서 부트스트랩 작업이 실패함

  • 노드가 올바르게 작동하지 않고 하둡에 체크인되지 않음

인스턴스 그룹이 SUSPENDED 상태이고 클러스터가 WAITING 상태인 경우 클러스터 단계를 추가하여 원하는 수의 코어 및 작업 노드를 재설정할 수 있습니다. 단계를 추가하면 클러스터 처리가 재개되고 인스턴스 그룹이 RUNNING 상태로 돌아갑니다.

일시 중단된 상태의 클러스터를 재설정하는 방법에 대한 자세한 내용은 일시 중단됨 상태 섹션을 참조하세요.