기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon SageMaker Studio Classic 문제 해결
중요
2023년 11월 30일부터 이전 Amazon SageMaker Studio 환경이 이제 Amazon SageMaker Studio Classic으로 명명되었습니다. 다음 섹션은 Studio Classic 애플리케이션 사용에 따라 다릅니다. 업데이트된 Studio 환경 사용에 대한 자세한 내용은 섹션을 참조하세요Amazon SageMaker Studio.
중요
Amazon SageMaker Studio 또는 Amazon SageMaker Studio Classic이 Amazon SageMaker 리소스를 생성할 수 있도록 허용하는 사용자 지정 IAM 정책도 해당 리소스에 태그를 추가할 수 있는 권한을 부여해야 합니다. Studio 및 Studio Classic은 생성한 리소스에 태그를 자동으로 지정하기 때문에 리소스에 태그를 추가할 수 있는 권한이 필요합니다. IAM 정책에서 Studio 및 Studio Classic이 리소스를 생성하도록 허용하지만 태그 지정은 허용하지 않는 경우 리소스를 생성하려고 할 때 “AccessDenied” 오류가 발생할 수 있습니다. 자세한 내용은 리소스에 태그를 지정할 SageMaker 수 있는 권한 제공 단원을 참조하십시오.
AWS Amazon용 관리형 정책 SageMaker 는 SageMaker 리소스를 생성할 수 있는 권한을 부여합니다. 여기에는 해당 리소스를 생성하는 동안 태그를 추가할 수 있는 권한이 이미 포함되어 있습니다.
이 주제에서는 설정 및 사용 중에 일반적인 Amazon SageMaker Studio Classic 문제를 해결하는 방법을 설명합니다. 다음은 Amazon SageMaker Studio Classic을 사용하는 동안 발생할 수 있는 일반적인 오류입니다. 각 오류 다음에는 해당 해결 방법이 나와 있습니다.
Studio Classic 애플리케이션 문제
Studio Classic 애플리케이션을 시작하고 사용할 때 다음과 같은 문제가 발생합니다.
-
화면이 로드되지 않음: WorkSpace를 지우고 기다려도 도움이 되지 않음
Studio Classic 애플리케이션을 시작할 때 팝업에 다음 메시지가 표시됩니다. 어떤 옵션을 선택하든 Studio Classic은 로드되지 않습니다.
Loading... The loading screen is taking a long time. Would you like to clear the workspace or keep waiting?
Studio Classic 워크스페이스에 여러 탭이 열려 있거나 Amazon 에 여러 파일이 있는 경우 Studio Classic 애플리케이션이 시작 지연될 수 있습니다EFS. Studio Classic 워크스페이스가 준비되면 몇 초 후에 이 팝업이 사라집니다.
옵션 중 하나를 선택한 후에도 스피너가 있는 로드 화면이 계속 표시되면 Studio Classic에서 사용하는 Amazon Virtual Private Cloud에 연결 문제가 있을 수 있습니다.
Studio Classic에서 사용하는 Amazon Virtual Private Cloud(Amazon VPC)의 연결 문제를 해결하려면 다음 네트워킹 구성을 확인합니다.
-
도메인이
VpcOnly
모드로 설정된 경우: 인터넷을 통한 트래픽을 포함하여 에 대한 Amazon VPC 엔드포인트 AWS STS또는 아웃바운드 트래픽에 대한 NAT 게이트웨이가 있는지 확인합니다. 이렇게 하려면 의 Studio 노트북을 외부 리소스VPC에 연결의 단계를 따르세요. -
AmazonVPC에서 DNS 제공하는 DNS 대신 사용자 지정으로 Amazon을 설정한 경우: Studio Classic에서 VPC 사용하는 Amazon에 추가된 각 Amazon VPC 엔드포인트에 대해 Dynamic Host Configuration Protocol(DHCP)을 사용하여 경로가 구성되어 있는지 확인합니다. 기본 및 사용자 지정 DHCP 옵션 세트 설정에 대한 자세한 내용은DHCP Amazon 의 옵션 세트를 VPC참조하세요.
-
-
Studio Classic 시작 시 내부 실패
Studio Classic을 시작할 때 Studio Classic UI를 볼 수 없습니다. 또한 다음과 비슷한 오류가 표시되며, 내부 오류가 오류 세부 정보로 표시됩니다.
Amazon SageMaker Studio The JupyterServer app default encountered a problem and was stopped.
이 오류는 여러 요인으로 인해 발생할 수 있습니다. 이 단계를 완료해도 문제가 해결되지 않으면 에서 문제를 생성합니다 https://aws.amazon.com/premiumsupport/.
Amazon EFS 탑재 대상 누락: Studio Classic은 Amazon을 스토리지EFS에 사용합니다. Amazon EFS 볼륨에는 Amazon SageMaker 도메인이 생성되는 각 서브넷에 대한 탑재 대상이 필요합니다. 이 Amazon EFS 탑재 대상을 실수로 삭제하면 Studio Classic 애플리케이션이 사용자의 파일 디렉터리를 탑재할 수 없으므로 탑재할 수 없습니다. 다음 단계에 따라 문제를 해결하세요.
마운트 대상을 확인하거나 생성하기 위해서입니다.
-
API 호출을 사용하여 도메인과 연결된 Amazon EFS 볼륨을DescribeDomain 찾습니다.
-
에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/efs/
에서 Amazon EFS 콘솔을 엽니다. -
Amazon EFS 볼륨 목록에서 도메인과 연결된 Amazon EFS 볼륨을 선택합니다.
-
Amazon EFS 세부 정보 페이지에서 네트워크 탭을 선택합니다. 도메인이 설정된 모든 서브넷에 대해 마운트 대상이 있는지 확인하세요.
-
탑재 대상이 누락된 경우 누락된 Amazon EFS 탑재 대상을 추가합니다. 지침은 마운트 대상 및 보안 그룹 생성 및 관리를 참조하세요.
-
누락된 탑재 대상을 생성한 후 Studio Classic 애플리케이션을 시작합니다.
-
-
사용자
.local
폴더의 충돌 파일 : Studio Classic에서 버전 1을 사용하는 JupyterLab 경우.local
폴더의 충돌 라이브러리가 Studio Classic 애플리케이션을 시작할 때 문제를 일으킬 수 있습니다. 이 문제를 해결하려면 사용자 프로필의 기본 JupyterLab 버전을 JupyterLab 3.0으로 업데이트합니다. JupyterLab 버전 보기 및 업데이트에 대한 자세한 내용은 섹션을 참조하세요JupyterLab 버전 관리.
-
ConfigurationError: LifecycleConfig Studio Classic을 시작할 때
Studio Classic을 시작할 때는 Studio Classic UI를 볼 수 없습니다. 이는 도메인에 연결된 기본 수명 주기 구성 스크립트에 문제가 있기 때문입니다.
수명 주기 구성 문제를 해결하려면
-
수명 주기 구성에 대한 Amazon CloudWatch Logs를 보고 실패를 초래한 명령을 추적합니다. 로그를 보려면 CloudWatch Logs에서 수명 주기 구성 프로세스 확인의 단계를 따르세요.
-
사용자 프로필 또는 도메인에서 기본 스크립트를 분리합니다. 자세한 내용은 수명 주기 구성 업데이트 및 분리 단원을 참조하십시오.
-
Studio Classic 애플리케이션을 시작합니다.
-
수명 주기 구성 스크립트를 디버깅하세요. 시스템 터미널에서 수명 주기 구성 스크립트를 실행하여 문제를 해결할 수 있습니다. 터미널에서 스크립트가 성공적으로 실행되면 스크립트를 사용자 프로필 또는 도메인에 연결할 수 있습니다.
-
-
SageMaker Studio Classic 핵심 기능은 사용할 수 없습니다.
Studio Classic을 열 때 이 오류 메시지가 표시되면 Python 패키지 버전 충돌 때문일 수 있습니다. 이는 노트북 또는 터미널에서 다음 명령을 사용하여 버전이 패키지 종속성과 충돌하는 Python SageMaker 패키지를 설치하는 경우에 발생합니다.
!pip install
pip install --user
다음 단계에 따라 문제를 해결하세요.
-
최근에 설치한 Python 패키지를 제거합니다. 제거할 패키지가 확실하지 않은 경우 에 문제를 생성합니다 https://aws.amazon.com/premiumsupport/.
-
Studio Classic 재시작:
-
파일 메뉴에서 Studio Classic을 종료합니다.
-
1분 정도 기다려 주세요.
-
페이지를 새로 고치거나 에서 열어 Studio Classic을 다시 엽니다 AWS Management Console.
-
충돌을 일으킨 패키지를 제거한 경우 문제가 해결되어야 합니다. 이 문제를 다시 발생시키지 않고 패키지를 설치하려면
--user
플래그 없이%pip install
를 사용하세요.문제가 지속되면 새 사용자 프로필을 생성하여 해당 사용자 프로필로 환경을 설정하세요.
이러한 솔루션이 문제를 해결하지 못하는 경우 에 문제를 생성합니다 https://aws.amazon.com/premiumsupport/.
-
-
에서 Studio Classic을 열 수 없습니다 AWS Management Console.
Studio Classic을 열 수 없고 모든 기본 설정으로 실행 중인 새 인스턴스를 만들 수 없는 경우 에 문제를 생성합니다 https://aws.amazon.com/premiumsupport/.
KernelGateway 애플리케이션 문제
다음 문제는 Studio Classic에서 시작되는 KernelGateway 애플리케이션에만 해당됩니다.
-
커널 세션에 액세스할 수 없습니다
사용자가 새 노트북을 시작하면 노트북 세션에 연결할 수 없습니다. KernelGateway 애플리케이션의 상태가 인 경우 다음을 확인하여 문제를 해결할
In Service
수 있습니다.-
보안 그룹 구성 확인
도메인이
VPCOnly
모드로 설정된 경우 도메인과 연결된 보안 그룹은 JupyterServer 및 KernelGateway 앱 간의 연결을8192-65535
위해 범위 내의 포트 간 트래픽을 허용해야 합니다.보안 그룹에 규칙을 추가하려면
-
DescribeDomain API 호출을 사용하여 도메인과 연결된 보안 그룹을 가져옵니다.
-
에 로그인 AWS Management Console 하고 에서 Amazon VPC 콘솔을 엽니다https://console.aws.amazon.com/vpc/
. -
왼쪽 탐색 창에서 보안 아래의 보안 그룹을 선택합니다.
-
도메인과 연결된 보안 그룹의 IDs를 기준으로 필터링합니다.
-
각 보안 그룹의 경우:
-
보안 그룹을 선택합니다.
-
보안 그룹 세부 정보 페이지에서 인바운드 규칙을 확인합니다. 범위
8192-65535
내 포트 간에 트래픽이 허용되는지 확인하세요.
-
보안 그룹 규칙에 대한 자세한 내용은 보안 그룹을 사용하여 리소스에 대한 트래픽 제어를 참조하세요.
VPCOnly
모드에서 Studio Classic을 사용하기 위한 요구 사항에 대한 자세한 내용은 섹션을 참조하세요의 Studio 노트북을 외부 리소스VPC에 연결. -
-
방화벽 및 WebSocket 연결 확인
KernelGateway 앱에
InService
상태가 있고 사용자가 Studio Classic 노트북 세션에 연결할 수 없는 경우 방화벽과 WebSocket 설정을 확인합니다.-
Studio Classic 애플리케이션을 시작합니다. 자세한 내용은 Amazon SageMaker Studio Classic 시작 단원을 참조하십시오.
-
웹 브라우저 개발자 도구 모음을 엽니다.
-
네트워크 탭을 선택합니다.
-
다음 형식과 일치하는 항목을 검색하세요.
wss://<domain-id>.studio.<region>.sagemaker.aws/jupyter/default/api/kernels/<unique-code>/channels?session_id=<unique-code>
항목의 상태 또는 응답 코드가 이외의 경우
101
네트워크 설정으로 인해 Studio Classic 애플리케이션과 KernelGateway 앱 간의 연결이 차단됩니다.이 문제를 해결하려면 네트워킹 설정을 관리하는 팀에 문의하여 Studio Classic 목록을 허용URL하고 WebSocket 연결을 활성화합니다.
-
-
-
리소스 할당량 초과로 인해 앱을 실행할 수 없음
사용자가 새 노트북을 시작하려고 하면 다음 오류 중 하나로 인해 노트북 생성이 실패합니다. 이는 리소스 할당량을 초과했기 때문입니다.
-
Unable to start more Apps of AppType [KernelGateway] and ResourceSpec(instanceType=[]) for UserProfile []. Please delete an App with a matching AppType and ResourceSpec, then try again
Studio Classic은 동일한 인스턴스에서 실행 중인 KernelGateway 앱을 최대 4개까지 지원합니다. 이 문제를 해결하려면 다음 중 한 가지 방법을 시도하면 됩니다.
인스턴스에서 실행 중인 기존 KernelGateway 애플리케이션을 삭제한 다음 새 노트북을 다시 시작합니다.
다른 인스턴스 유형에서 새 노트북을 시작합니다.
자세한 내용은 인스턴스 유형 변경 단원을 참조하십시오.
-
An error occurred (ResourceLimitExceeded) when calling the CreateApp operation
이 경우 계정에는 지정된 인스턴스 유형에 Studio Classic 애플리케이션을 생성할 수 있는 충분한 제한이 없습니다. 이 문제를 해결하려면 에서 Service Quotas 콘솔로 이동합니다https://console.aws.amazon.com/servicequotas/
. 해당 콘솔에서 Studio KernelGateway Apps running on
한도 증가를 요청하세요. 자세한 내용은 AWS 서비스 할당량을 참조하세요.instance-type
instance
-