사용 설명서 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용 설명서

이 섹션에서는 데이터 과학자와 데이터 엔지니어가 Studio 또는 Studio Classic에서 Amazon EMR 클러스터를 시작, 검색, 연결 또는 종료하는 방법을 다룹니다.

사용자가 클러스터를 나열하거나 실행하려면 먼저 관리자가 Studio 환경에서 필요한 설정을 구성해야 합니다. 관리자가 Amazon EMR 클러스터의 셀프 프로비저닝 및 목록 작성을 허용하도록 Studio 환경을 구성하는 방법에 대한 자세한 내용은 을 참조하십시오. 관리자 가이드

스튜디오 또는 스튜디오 클래식에서 Amazon EMR 클러스터에 연결할 수 있도록 지원되는 이미지 및 커널

다음 이미지와 커널은 Apache Livy를 사용하여 SparkMagic라이브러리를 통해 원격 Spark (Amazon EMR) 클러스터에 연결하는 JupyterLab 확장 프로그램과 함께 sagemaker-studio-analytics-extension제공됩니다.

  • 스튜디오 사용자의 경우: SageMaker 배포는 노트북 인스턴스의 기본 이미지로 사용되는 데이터 과학용 Docker 환경입니다. JupyterLab 모든 버전의 SageMaker배포판에는 sagemaker-studio-analytics-extension 사전 설치되어 있습니다.

  • Studio Classic 사용자의 경우: 다음 이미지가 사전 설치되어 제공됩니다. sagemaker-studio-analytics-extension

    • DataScience — 파이썬 3 커널

    • DataScience 2.0 — 파이썬 3 커널

    • DataScience 3.0 — 파이썬 3 커널

    • SparkAnalytics 1.0 — SparkMagic 및 PySpark 커널

    • SparkAnalytics 2.0 — SparkMagic 및 커널 PySpark

    • SparkMagic — SparkMagic 및 커널 PySpark

    • PyTorch 1.8 — 파이썬 3 커널

    • TensorFlow 2.6 — 파이썬 3 커널

    • TensorFlow 2.11 — 파이썬 3 커널

다른 내장 이미지 또는 자체 이미지를 사용하여 Amazon EMR 클러스터에 연결하려면 사용자 고유 이미지 가져오기의 지침을 따릅니다.

사용자 고유 이미지 가져오기

Studio 또는 Studio Classic에서 자체 이미지를 가져와서 노트북이 Amazon EMR 클러스터에 연결되도록 하려면 커널에 sagemaker-studio-analytics-extension다음 확장 프로그램을 설치하십시오. 라이브러리를 통해 SageMaker 스튜디오 또는 스튜디오 클래식 노트북을 Spark (Amazon EMR) 클러스터에 연결할 수 있습니다. SparkMagic

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

또한 Kerberos 인증을 사용하여 Amazon EMR에 연결하려면 kinit 클라이언트를 설치해야 합니다. OS에 따라 kinit 클라이언트를 설치하는 명령이 다를 수 있습니다. Ubuntu(Debian 기반) 이미지를 가져오려면 apt-get install -y -qq krb5-user 명령을 사용합니다.

SageMaker Studio 또는 Studio Classic에서 자체 이미지를 가져오는 방법에 대한 자세한 내용은 자체 이미지 가져오기를 참조하십시오. SageMaker