기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Python용 SageMaker Spark(PySpark) 예제를 사용하기 위한 리소스
Amazon SageMaker 은 Apache Spark 애플리케이션을SageMaker PySpark
다운로드 PySpark
SageMaker Spark
SageMaker Spark 라이브러리 설치에 대한 지침은 다음 옵션을 사용하거나 SageMaker PySpark
-
pip를 사용하여 설치:
pip install sagemaker_pyspark
-
소스에서 를 설치합니다.
git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
-
Sparkmagic (PySpark)
또는Sparkmagic (PySpark3)
커널을 사용하는 노트북 인스턴스에서 새 노트북을 생성하고 원격 Amazon EMR 클러스터에 연결할 수도 있습니다.참고
Amazon EMR 클러스터는
AmazonSageMakerFullAccess
정책이 연결된 IAM 역할로 구성되어야 합니다. EMR 클러스터에 대한 역할 구성에 대한 자세한 내용은 Amazon 관리 안내서의 서비스에 대한 Amazon EMR 권한에 대한 IAM AWS 역할 구성을 참조하세요. EMR
PySpark 예제
사용 예제는 다음을 SageMaker PySpark참조하세요.
-
SageMaker Spark
GitHub 리포지토리.
노트북 인스턴스에서 노트북을 실행하려면 예제 노트북 액세스을 참조하세요. Studio에서 노트북을 실행하려면 Amazon SageMaker Studio Classic 노트북 생성 또는 열기을 참조하세요.