수명 주기 구성 디버깅 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

수명 주기 구성 디버깅

다음 주제에서는 수명 주기 구성에 대한 정보를 얻고 디버깅하는 방법을 보여줍니다.

CloudWatch Logs에서 라이프사이클 구성 프로세스 확인

수명 주기 구성은 STDOUTSTDERR만 기록합니다.

STDOUT는 bash 스크립트의 기본 출력입니다. bash 명령어 끝에 >&2를 추가하여 STDERR에 쓸 수 있습니다. 예: echo 'hello'>&2.

수명 주기 구성 로그는 Amazon을 AWS 계정 사용하는 사용자에게 게시됩니다 CloudWatch. 이러한 로그는 CloudWatch 콘솔의 /aws/sagemaker/studio 로그 스트림에서 찾을 수 있습니다.

  1. https://console.aws.amazon.com/cloudwatch/ 에서 CloudWatch 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 [Logs] 를 선택합니다. 드롭다운 메뉴에서 로그 그룹을 선택합니다.

  3. 로그 그룹 페이지에서 aws/sagemaker/studio를 검색합니다.

  4. 로그 그룹을 선택합니다.

  5. 로그 그룹 세부 정보 페이지에서 로그 스트림 탭을 선택합니다.

  6. 특정 앱의 로그를 찾으려면 다음 형식을 사용하여 로그 스트림을 검색하십시오.

    domain-id/user-profile-name/app-type/app-name

    다음 검색 문자열은 도메인d-m85lcu8vbqmz, 사용자 프로필i-sonic-js, 애플리케이션 유형 JupyterLab 및 애플리케이션 이름에 대한 수명 주기 구성 로그를 찾습니다test-lcc-echo.

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/test-lcc-echo
  7. 스크립트 실행 로그를 보려면 추가된 LifecycleConfigOnStart 로그 스트림을 선택합니다.

수명 주기 구성의 제한 시간

수명 주기 구성 시간 초과 제한은 5분입니다. 수명 주기 구성 스크립트를 실행하는 데 5분 이상 걸리는 경우 오류가 발생합니다.

이 오류를 해결하려면 수명 주기 구성 스크립트가 5분 이내에 완료되어야 합니다.

스크립트의 런타임을 줄이려면 다음을 시도해 보십시오.

  • 불필요한 단계를 줄이십시오. 예를 들어 대규모 패키지를 설치할 conda 환경을 제한합니다.

  • 작업을 병렬 프로세스로 실행합니다.

  • 스크립트에서 nohup 명령어를 사용하여 끊김 신호가 무시되도록 하여 스크립트가 중단되지 않고 실행되도록 하세요.