이 페이지 개선에 도움 주기
이 사용자 설명서에 기여하고 싶으신가요? 모든 페이지의 오른쪽 창에 있는 GitHub에서 이 페이지 편집 링크를 선택합니다. 여러분의 기여는 모두를 위한 더 나은 사용자 설명서를 만드는 데 도움이 됩니다.
이 주제에서는 Amazon EKS 클러스터에서 노드 상태 모니터링에 사용할 수 있는 도구와 방법을 설명합니다. 관련 정보에는 노드 수준 문제를 식별하고 진단하는 데 도움이 되는 노드 조건, 이벤트, 감지 사례가 포함됩니다. 여기에 설명된 명령과 패턴을 사용하여 노드 상태 리소스를 검사하고, 상태 조건을 해석하고, 운영 문제 해결을 위해 노드 이벤트를 분석할 수 있습니다.
모든 노드에 대한 Kubernetes 명령을 사용하여 일부 노드 상태 정보를 가져올 수 있습니다. 또한 Amazon EKS Auto Mode 또는 Amazon EKS 관리형 추가 기능을 통해 노드 모니터링 에이전트를 사용하는 경우 문제 해결에 도움이 되는 더욱 다양한 노드 신호를 얻을 수 있습니다. 노드 모니터링 에이전트에서 감지된 상태 문제에 대한 설명은 관찰성 대시보드에서도 확인할 수 있습니다. 자세한 내용은 노드 자동 복구 활성화 및 노드 상태 문제 조사 단원을 참조하십시오.
노드 조건
노드 조건은 인스턴스 교체 또는 재부팅과 같은 문제 해결 작업이 필요한 터미널 문제를 나타냅니다.
모든 노드에 대한 조건을 가져오려면:
kubectl get nodes -o 'custom-columns=NAME:.metadata.name,CONDITIONS:.status.conditions[*].type,STATUS:.status.conditions[*].status'
특정 노드에 대한 세부 조건을 가져오려면
kubectl describe node
node-name
정상 노드의 조건 출력 예제:
- lastHeartbeatTime: "2024-11-21T19:07:40Z"
lastTransitionTime: "2024-11-08T03:57:40Z"
message: Monitoring for the Networking system is active
reason: NetworkingIsReady
status: "True"
type: NetworkingReady
네트워킹 문제가 있는 비정상 노드의 조건 예제:
- lastHeartbeatTime: "2024-11-21T19:12:29Z"
lastTransitionTime: "2024-11-08T17:04:17Z"
message: IPAM-D has failed to connect to API Server which could be an issue with
IPTable rules or any other network configuration.
reason: IPAMDNotReady
status: "False"
type: NetworkingReady
노드 이벤트
노드 이벤트는 일시적인 문제 또는 최적이 아닌 구성을 나타냅니다.
노드 모니터링 에이전트가 보고한 모든 이벤트를 가져오려면
노드 모니터링 에이전트를 사용할 수 있는 경우 다음 명령을 실행할 수 있습니다.
kubectl get events --field-selector=reportingComponent=eks-node-monitoring-agent
샘플 출력:
LAST SEEN TYPE REASON OBJECT MESSAGE
4s Warning SoftLockup node/ip-192-168-71-251.us-west-2.compute.internal CPU stuck for 23s
모든 노드에 대한 이벤트를 가져오려면
kubectl get events --field-selector involvedObject.kind=Node
특정 노드에 대한 이벤트를 가져오려면
kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=
node-name
이벤트를 실시간으로 보려면
kubectl get events -w --field-selector involvedObject.kind=Node
이벤트 출력 예제:
LAST SEEN TYPE REASON OBJECT MESSAGE 2m Warning MemoryPressure Node/node-1 Node experiencing memory pressure 5m Normal NodeReady Node/node-1 Node became ready
일반적인 문제 해결 명령
# Get comprehensive node status
kubectl get node node-name
-o yaml
# Watch node status changes
kubectl get nodes -w
# Get node metrics
kubectl top node