Amazon ECS Anywhere 문제 해결 - Amazon Elastic Container Service

Amazon ECS Anywhere 문제 해결

Amazon ECS Anywhere는 외부 인스턴스(예: 온프레미스 서버 또는 가상 머신(VM))을 Amazon ECS 클러스터에 등록하도록 지원합니다. 발생할 수 있는 일반적인 문제와 이에 대한 일반적인 문제 해결 권장 사항은 다음과 같습니다.

외부 인스턴스 등록 문제

Amazon ECS 클러스터에 외부 인스턴스를 등록할 때 다음 요구 사항을 충족해야 합니다.

  • AWS Systems Manager 활성화(활성화 ID활성화 코드로 구성됨)를 검색해야 합니다. 외부 인스턴스를 Systems Manager 관리형 인스턴스로 등록하는 데 사용합니다. Systems Manager 활성화를 요청하면 등록 제한 및 만료 날짜를 지정합니다. 등록 제한은 정품 인증을 사용하여 등록할 수 있는 인스턴스의 최대 수를 지정합니다. 등록 제한의 기본값은 1개의 인스턴스입니다. 만료 날짜는 정품 인증이 만료되는 시기를 지정합니다. 기본값은 24시간입니다. 외부 인스턴스를 등록하는 데 사용하는 Systems Manager 정품 인증이 유효하지 않은 경우 새 인스턴스를 요청합니다. 자세한 내용은 클러스터에 외부 인스턴스 등록 단원을 참조하십시오.

  • IAM 정책은 AWS API 작업과 통신하는 데 필요한 권한을 외부 인스턴스에 제공하는 데 사용됩니다. 이 관리형 정책이 제대로 생성되지 않고 필요한 권한이 포함되어 있지 않으면 외부 인스턴스 등록이 실패합니다. 자세한 내용은 ECS Anywhere IAM 역할 단원을 참조하십시오.

  • Amazon ECS는 Docker, Amazon ECS 컨테이너 에이전트 및 Systems Manager Agent를 외부 인스턴스에 설치하는 설치 스크립트를 제공합니다. 설치 스크립트가 실패하면 오류가 발생하지 않고 동일한 인스턴스에서 스크립트를 다시 실행할 수 없습니다. 이 경우 정리 프로세스에 따라 인스턴스에서 AWS 리소스를 지우고 설치 스크립트를 다시 실행할 수 있습니다. 자세한 내용은 외부 인스턴스 등록 취소 섹션을 참조하세요.

    참고

    설치 스크립트가 Systems Manager 정품 인증을 성공적으로 요청하여 사용한 경우 설치 스크립트를 다시 실행하면 Systems Manager 정품 인증이 다시 사용됩니다. 이로 인해 해당 정품 인증에 대한 등록 제한에 도달하게 될 수 있습니다. 이 제한에 도달하면 새 정품 인증을 생성해야 합니다.

  • GPU 워크로드용 외부 인스턴스에서 설치 스크립트를 실행할 때 NVIDIA 드라이버가 제대로 감지되지 않거나 구성되지 않으면 오류가 발생합니다. 설치 스크립트는 nvidia-smi 명령을 사용하여 NVIDIA 드라이버의 존재를 확인합니다.

외부 인스턴스 네트워크 문제

변경 사항을 전달하려면 외부 인스턴스에 AWS에 대한 네트워크 연결이 필요합니다. 외부 인스턴스에 AWS에 대한 네트워크 연결이 끊긴 경우 수동으로 중지하지 않는 한 인스턴스에서 실행 중인 작업이 계속 실행됩니다. AWS에 대한 연결이 복원되면 외부 인스턴스의 Amazon ECS 컨테이너 에이전트 및 Systems Manager Agent에서 사용하는 AWS 자격 증명이 자동으로 갱신됩니다. 외부 인스턴스와 AWS 간의 통신에 사용되는 AWS 도메인에 관한 자세한 내용은 ECS Anywhere를 통한 네트워킹 섹션을 참조하세요.

외부 인스턴스에서의 작업 실행 문제

외부 인스턴스에서 작업 또는 컨테이너가 실행되지 않는 경우 가장 일반적인 원인은 네트워크 또는 권한과 관련이 있습니다. 컨테이너가 Amazon ECR에서 이미지를 가져오거나 컨테이너 로그를 CloudWatch Logs로 보내도록 구성된 경우 태스크 정의에서 유효한 작업 실행 IAM 역할을 지정해야 합니다. 유효한 작업 실행 IAM 역할이 없으면 컨테이너가 시작되지 않습니다. 네트워크 관련 문제에 대한 자세한 내용은 외부 인스턴스 네트워크 문제 섹션을 참조하세요.

중요

Amazon ECS는 Amazon ECS 로그 수집 도구를 제공합니다. 문제 해결을 위해 외부 인스턴스에서 로그를 수집하는 데 사용할 수 있습니다. 자세한 내용은 Amazon ECS 로그 수집기 단원을 참조하십시오.