Amazon EMR Studio - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EMR Studio

Amazon EMR Studio는 Amazon EMR 클러스터에서 실행되는 완전관리형 Jupyter 노트북을 위한 웹 기반 IDE (통합 개발 환경) 입니다. 팀이 R, 파이썬, 스칼라 및 PySpark로 작성된 애플리케이션을 개발, 시각화 및 디버깅하도록 Amazon EMR Studio를 설정할 수 있습니다. Amazon EMR 스튜디오는AWS Identity and Access Management(IAM) 및AWS SSO사용자는 회사 자격 증명을 사용하여 로그인할 수 있습니다.

EMR 스튜디오를 무료로 만들 수 있습니다. EMR Studio를 사용하는 경우 Amazon S3 스토리지 및 Amazon EMR 클러스터에 적용되는 요금이 적용됩니다. 제품 세부 정보 및 주요 내용은 서비스 페이지를 참조하십시오.Amazon EMR Studio.

EMR 스튜디오의 주요 기능

Amazon EMR 스튜디오는 다음의 기능을 제공합니다.

  • 을 사용하여 사용자 인증AWS Identity and Access Management(IAM) 또는AWS Single Sign-On(AWS SSO) 및 엔터프라이즈 ID 공급자

  • 필요에 따라 Amazon EMR 클러스터에 액세스하고 시작하여 Jupyter 노트북 작업을 실행할 수 있습니다.

  • EKS 클러스터의 Amazon EMR에 Connect 작업 실행 시 작업을 제출합니다.

  • 예제 노트북을 탐색하고 저장합니다. 예제 노트북에 대한 자세한 내용은 를 참조하십시오.EMR 노트북 예제 GitHub 저장소.

  • 파이썬, PySpark, 스파크 스칼라, 스파크 R 또는 SparkSQL을 사용하여 데이터를 분석하고 사용자 정의 커널과 라이브러리를 설치합니다.

  • 동일한 Workspace에서 다른 사용자와 실시간으로 협업합니다. 자세한 정보는 Workspace 협업 구성을 참조하십시오.

  • 노트북에서 데이터로 작업하기 전에 EMR Studio SQL 탐색기를 사용하여 데이터 카탈로그를 탐색하고 SQL 쿼리를 실행하고 결과를 다운로드할 수 있습니다.

  • Apache Airflow 또는 Apache Airflow용 Amazon 관리형 워크플로와 같은 오케스트레이션 도구를 사용하여 예약된 워크플로의 일부로 매개변수화된 노트북을 실행합니다. 자세한 내용은 단원을 참조하십시오.MWAA를 사용하여 EMR Notebooks 노트북에서 분석 작업 오케스트레이션의AWS빅 데이터 블로그.

  • 링크 코드 리포지토리 (예: GitHub BitBucket 및

  • Spark 히스토리 서버, Tez의 UI 또는 YARN 타임라인 서버를 사용하여 작업을 추적하고 디버그합니다.

EMR 스튜디오는 또한 HIPAA 자격을 갖추고 있으며 히트러스트 CSF 및 SOC 2에 따라 인증을 받았습니다. HIPAA 규정 준수에 대한 자세한 내용은AWS서비스, 참조http://aws.amazon.com/compliance/hipaa-compliance/. HITRUST CSF 규정 준수에 대한 자세한 내용은AWS서비스, 참조http://aws.amazon.com/compliance/hitrust/. 다른 규정 준수 프로그램에 대한 자세한 내용은AWS서비스, 참조AWS규정 준수 프로그램 제공 범위 내 서비스.