아마존 SageMaker 스튜디오 클래식 문제 해결 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

아마존 SageMaker 스튜디오 클래식 문제 해결

중요

2023년 11월 30일부터 이전 아마존 SageMaker 스튜디오 익스피리언스는 이제 아마존 SageMaker 스튜디오 클래식으로 명명되었습니다. 다음 섹션은 스튜디오 클래식 애플리케이션 사용에 대한 내용입니다. 업데이트된 Studio 환경 사용에 대한 자세한 내용은 을 참조하십시오아마존 SageMaker 스튜디오.

이 주제에서는 설정 및 사용 중에 발생하는 일반적인 Amazon SageMaker Studio Classic 문제를 해결하는 방법을 설명합니다. 다음은 Amazon SageMaker Studio Classic을 사용하는 동안 발생할 수 있는 일반적인 오류입니다. 각 오류 다음에는 해당 해결 방법이 나와 있습니다.

스튜디오 클래식 애플리케이션 문제

Studio Classic 애플리케이션을 시작하고 사용할 때 다음과 같은 문제가 발생합니다.

  • 화면이 로드되지 않음: WorkSpace를 지우고 기다려도 도움이 되지 않음

    Studio Classic 애플리케이션을 시작하면 팝업에 다음 메시지가 표시됩니다. 어떤 옵션을 선택하든 Studio Classic은 로드되지 않습니다.

    Loading... The loading screen is taking a long time. Would you like to clear the workspace or keep waiting?

    Studio Classic 작업 영역에 여러 탭이 열려 있거나 Amazon EFS에 여러 파일이 있는 경우 Studio Classic 애플리케이션 실행이 지연될 수 있습니다. 이 팝업은 Studio Classic 작업 영역이 준비되고 몇 초 후에 사라집니다.

    두 옵션 중 하나를 선택한 후에도 스피너가 있는 로딩 화면이 계속 표시되면 Studio Classic에서 사용하는 Amazon Virtual Private Cloud에 연결 문제가 있을 수 있습니다. 

    스튜디오 클래식에서 사용하는 Amazon VPC (가상 사설 클라우드) 의 연결 문제를 해결하려면 다음 네트워킹 구성을 확인하십시오.

    • 도메인이 VpcOnly모드로 설정된 경우: AWS STS용 Amazon VPC 엔드포인트가 있는지 확인하거나 인터넷을 통한 트래픽을 포함한 아웃바운드 트래픽을 위한 NAT 게이트웨이가 있는지 확인하십시오. 이렇게 하려면 VPC의 SageMaker 스튜디오 클래식 노트북을 외부 리소스에 연결의 단계를 따르십시오.

    • Amazon VPC가 Amazon에서 제공하는 DNS 대신 사용자 지정 DNS로 설정된 경우: 스튜디오 클래식에서 사용하는 Amazon VPC에 추가된 각 Amazon VPC 엔드포인트에 대해 동적 호스트 구성 프로토콜 (DHCP) 을 사용하여 경로가 구성되어 있는지 확인하십시오. 기본 및 사용자 지정 DHCP 옵션 세트 설정에 대한 자세한 내용은 Amazon VPC의 DHCP 옵션 세트를 참조하십시오.

  • 스튜디오 클래식 시작 시 내부 오류가 발생했습니다.

    스튜디오 클래식을 시작하면 스튜디오 클래식 UI를 볼 수 없습니다. 또한 다음과 비슷한 오류가 표시되며, 내부 오류가 오류 세부 정보로 표시됩니다.

    Amazon SageMaker Studio The JupyterServer app default encountered a problem and was stopped.

    이 오류는 여러 요인으로 인해 발생할 수 있습니다. 이 단계를 완료해도 문제가 해결되지 않는 경우 https://aws.amazon.com/premiumsupport/로 이슈를 생성하십시오. 

    • Amazon EFS 탑재 대상 누락: 스튜디오 클래식은 Amazon EFS를 스토리지로 사용합니다. Amazon EFS 볼륨에는 Amazon SageMaker 도메인이 생성되는 각 서브넷에 대한 탑재 대상이 필요합니다. 이 Amazon EFS 탑재 대상이 실수로 삭제되면 사용자의 파일 디렉토리를 마운트할 수 없기 때문에 Studio Classic 애플리케이션을 로드할 수 없습니다. 다음 단계에 따라 문제를 해결하십시오.

      마운트 대상을 확인하거나 생성하기 위해서입니다.
      1. DescribeDomainAPI 호출을 사용하여 도메인과 연결된 Amazon EFS 볼륨을 찾습니다. 

      2. AWS Management Console에 로그인한 후 https://console.aws.amazon.com/efs/에서 Amazon EFS 콘솔을 엽니다.

      3. Amazon EFS 볼륨 목록에서 도메인과 연결된 Amazon EFS 볼륨을 선택합니다.

      4. Amazon EFS 세부 정보 페이지에서 네트워크 탭을 선택합니다. 도메인이 설정된 모든 서브넷에 대해 마운트 대상이 있는지 확인하십시오.

      5. 마운트 대상이 없는 경우 누락된 Amazon EFS 마운트 대상을 추가하십시오. 지침은 마운트 대상 및 보안 그룹 생성 및 관리를 참조하십시오.

      6. 누락된 탑재 대상을 생성한 후 Studio Classic 애플리케이션을 시작합니다.

    • 사용자 .local 폴더의 파일 충돌: Studio Classic에서 버전 1을 사용하는 경우 Studio Classic에서 JupyterLab 버전 1을 사용하는 경우 .local 폴더의 라이브러리 충돌로 인해 Studio Classic 애플리케이션을 시작할 때 문제가 발생할 수 있습니다. 이 문제를 해결하려면 사용자 프로필의 기본 JupyterLab 버전을 3.0으로 업데이트하십시오. JupyterLab JupyterLab 버전 보기 및 업데이트에 대한 자세한 내용은 을 참조하십시오JupyterLab 버전 관리.

  • ConfigurationError: 스튜디오 클래식을 시작할 LifecycleConfig 때

    스튜디오 클래식을 시작할 때는 스튜디오 클래식 UI를 볼 수 없습니다. 이는 도메인에 연결된 기본 수명 주기 구성 스크립트에 문제가 있기 때문입니다.

    수명 주기 구성 문제를 해결하려면
    1. Amazon CloudWatch Logs에서 수명 주기 구성을 확인하여 실패를 일으킨 명령을 추적하십시오. 로그를 보려면 CloudWatch Logs에서 라이프사이클 구성 프로세스를 확인하십시오.의 단계를 따르십시오.

    2. 사용자 프로필 또는 도메인에서 기본 스크립트를 분리합니다. 자세한 설명은 수명 주기 구성 업데이트 및 분리 섹션을 참조하세요.

    3. 스튜디오 클래식 애플리케이션을 실행합니다.

    4. 수명 주기 구성 스크립트를 디버깅하십시오. 시스템 터미널에서 수명 주기 구성 스크립트를 실행하여 문제를 해결할 수 있습니다. 터미널에서 스크립트가 성공적으로 실행되면 스크립트를 사용자 프로필 또는 도메인에 연결할 수 있습니다.

  • SageMaker 스튜디오 클래식 핵심 기능은 사용할 수 없습니다.

    Studio Classic을 열 때 이 오류 메시지가 표시되면 Python 패키지 버전 충돌 때문일 수 있습니다. 이는 노트북이나 터미널에서 다음 명령을 사용하여 SageMaker 패키지 종속성과 버전이 충돌하는 Python 패키지를 설치한 경우에 발생합니다.

    !pip install
    pip install --user

    다음 단계에 따라 문제를 해결하십시오.

    1. 최근에 설치한 Python 패키지를 제거합니다. 어떤 패키지를 제거해야 할지 잘 모르겠으면 https://aws.amazon.com/premiumsupport/로 이슈를 생성하십시오. 

    2. 스튜디오 클래식을 다시 시작합니다.

      1. 파일 메뉴에서 스튜디오 클래식을 종료합니다.

      2. 1분 정도 기다려 주십시오.

      3. 페이지를 새로 고치거나 에서 열어 Studio Classic을 AWS Management Console 다시 엽니다.

    충돌을 일으킨 패키지를 제거한 경우 문제가 해결되어야 합니다. 이 문제를 다시 발생시키지 않고 패키지를 설치하려면 --user플래그 없이 %pip install를 사용하십시오.

    문제가 지속되면 새 사용자 프로필을 생성하여 해당 사용자 프로필로 환경을 설정하십시오.

    이러한 해결 방법으로도 문제가 해결되지 않으면 https://aws.amazon.com/premiumsupport/로 이슈를 생성하십시오. 

  • 에서 스튜디오 클래식을 열 수 없습니다. AWS Management Console

    스튜디오 클래식을 열 수 없고 기본 설정이 모두 적용된 새 실행 인스턴스를 만들 수 없는 경우 https://aws.amazon.com/premiumsupport/ 으로 이슈를 만들어 보세요. 

KernelGateway 애플리케이션 문제

다음 문제는 Studio Classic에서 실행되는 KernelGateway 응용 프로그램에만 해당됩니다.

  • 커널 세션에 액세스할 수 없습니다

    사용자가 새 노트북을 시작하면 노트북 세션에 연결할 수 없습니다. KernelGateway 애플리케이션 상태가 In Service 인 경우 다음을 확인하여 문제를 해결할 수 있습니다.

    • 보안 그룹 구성 확인

      도메인이 VPCOnly 모드로 설정된 경우 도메인과 연결된 보안 그룹은 JupyterServer A와 KernelGateway 앱 간의 연결을 8192-65535 위해 범위 내의 포트 간 트래픽을 허용해야 합니다.

      보안 그룹에 규칙을 추가하려면
      1. DescribeDomainAPI 호출을 사용하여 도메인과 연결된 보안 그룹을 가져옵니다.

      2. AWS Management Console에 로그인하고 https://console.aws.amazon.com/vpc/에서 Amazon VPC 콘솔을 엽니다.

      3. 왼쪽 탐색 창에서 보안 아래의 보안 그룹을 선택합니다.

      4. 도메인과 연결된 보안 그룹의 ID로 필터링합니다.

      5. 각 보안 그룹의 경우:

        1. 보안 그룹을 선택합니다.

        2. 보안 그룹 세부 정보 페이지에서 인바운드 규칙을 확인합니다. 범위 8192-65535내 포트 간에 트래픽이 허용되는지 확인하십시오.

      보안 그룹 규칙에 대한 자세한 내용은 보안 그룹을 사용하여 리소스에 대한 트래픽 제어를 참조하십시오. Studio Classic을 VPCOnly 모드에서 사용하기 위한 요구 사항에 대한 자세한 내용은 을 참조하십시오VPC의 SageMaker 스튜디오 클래식 노트북을 외부 리소스에 연결.

    • 방화벽 및 WebSocket 연결 확인

      KernelGateway 앱에 InService 상태가 있고 사용자가 Studio Classic 노트북 세션에 연결할 수 없는 경우 방화벽과 WebSocket 설정을 확인하십시오.

      1. 스튜디오 클래식 애플리케이션을 실행합니다. 자세한 설명은 아마존 SageMaker 스튜디오 클래식 출시 섹션을 참조하세요.

      2. 웹 브라우저 개발자 도구 모음을 엽니다.

      3. 네트워크 탭을 선택합니다.

      4. 다음 형식과 일치하는 항목을 검색하십시오.

        wss://<domain-id>.studio.<region>.sagemaker.aws/jupyter/default/api/kernels/<unique-code>/channels?session_id=<unique-code>

        항목의 상태 또는 응답 코드가 이외의 101 코드인 경우 네트워크 설정으로 인해 Studio Classic 애플리케이션과 KernelGateway 앱 간의 연결이 차단되고 있는 것입니다.

        이 문제를 해결하려면 네트워킹 설정을 관리하는 팀에 문의하여 Studio Classic URL을 허용하고 WebSocket 연결을 활성화하십시오. 

  • 리소스 할당량 초과로 인해 앱을 실행할 수 없음

    사용자가 새 노트북을 시작하려고 하면 다음 오류 중 하나로 인해 노트북 생성이 실패합니다. 이는 리소스 할당량을 초과했기 때문입니다.

    • Unable to start more Apps of AppType [KernelGateway] and ResourceSpec(instanceType=[]) for UserProfile []. Please delete an App with a matching AppType and ResourceSpec, then try again

      Studio Classic은 동일한 인스턴스에서 실행 중인 KernelGateway 앱을 최대 4개까지 지원합니다. 이 문제를 해결하려면 다음 중 한 가지 방법을 시도하면 됩니다.

      • 인스턴스에서 실행 중인 기존 KernelGateway 애플리케이션을 삭제한 다음 새 노트북을 다시 시작합니다.

      • 다른 인스턴스 유형에서 새 노트북을 시작합니다.

      자세한 설명은 인스턴스 유형 변경 섹션을 참조하세요.

    • An error occurred (ResourceLimitExceeded) when calling the CreateApp operation

      이 경우 계정에는 지정된 인스턴스 유형에서 Studio Classic 애플리케이션을 생성할 수 있는 충분한 제한이 없습니다. 이 문제를 해결하려면 https://console.aws.amazon.com/servicequotas/에서 Service Quotas콘솔로 이동하십시오. 해당 콘솔에서 Studio KernelGateway Apps running on instance-type instance한도 증가를 요청하십시오. 자세한 내용은 AWS서비스 할당량을 참조하십시오.