Amazon EMR Studio - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EMR Studio

Amazon EMR Studio는 Amazon EMR 클러스터에서 실행되는 완전관리형 Jupyter Notebook을 위한 웹 기반 통합 개발 환경 (IDE) 입니다. 팀에서 R, Python, Scala 및 로 작성된 애플리케이션을 개발, 시각화 및 디버그할 수 있도록 EMR Studio를 설정할 수 PySpark 있습니다. EMR Studio는AWS Identity and Access Management (IAM) 및 IAM ID 센터와 통합되어 있으므로 사용자는 회사 자격 증명을 사용하여 로그인할 수 있습니다.

EMR 스튜디오를 무료로 만들 수 있습니다. EMR Studio를 사용하는 경우 Amazon S3 스토리지 및 Amazon EMR 클러스터에 대한 해당 요금이 적용됩니다. 제품 세부 정보 및 주요 내용은 Amazon EMR Studio의 서비스 페이지를 참조하십시오.

EMR 스튜디오의 주요 기능

Amazon EMR Studio는 다음의 기능을 제공합니다.

  • AWS Identity and Access Management(IAM) 또는AWS IAM Identity Center (successor to AWS Single Sign-On) (IAM ID 센터) 및 엔터프라이즈 자격 증명 공급자를 통해 사용자를 인증합니다.

  • 필요에 따라 Amazon EMR 클러스터에 액세스하고 실행하여 Jupyter 노트북 작업을 실행할 수 있습니다.

  • EKS 클러스터의 Amazon EMR에 Connect 작업 실행 시 작업을 제출합니다.

  • 예제 노트북을 탐색하고 저장하세요. 예제 노트북에 대한 자세한 내용은 EMR Studio Notebook 예제 GitHub 리포지토리를 참조하십시오.

  • 파이썬, 스파크 스칼라 PySpark, 스파크 R 또는 SparkSQL을 사용하여 데이터를 분석하고 사용자 지정 커널과 라이브러리를 설치합니다.

  • 동일한 작업 공간에서 다른 사용자와 실시간으로 협업할 수 있습니다. 자세한 내용은 Workspace 협업 구성을 참조하세요.

  • 노트북에서 데이터로 작업하기 전에 EMR Studio SQL Explorer를 사용하여 데이터 카탈로그를 검색하고, SQL 쿼리를 실행하고, 결과를 다운로드할 수 있습니다.

  • Apache Airflow 또는 Apache Airflow용 Amazon 관리형 워크플로와 같은 오케스트레이션 도구를 사용하여 스케줄링된 워크플로의 일부로 파라미터화된 노트북을 실행할 수 있습니다. 자세한 내용은AWS 빅데이터 블로그의 MWAA를 사용하여 EMR Notebooks Notebook에서 분석 작업 오케스트레이션을 참조하십시오.

  • GitHub 및 와 같은 코드 리포지토리를 연결합니다 BitBucket.

  • Spark 히스토리 서버, Tez UI 또는 YARN 타임라인 서버를 사용하여 작업을 추적하고 디버깅할 수 있습니다.

EMR 스튜디오는 또한 HIPAA 자격을 갖추고 있으며 HITRUST CSF 및 SOC 2에 따라 인증을 받았습니다. AWS서비스에 대한 HIPAA 규정 준수에 대한 자세한 내용은 을 참조하십시오http://aws.amazon.com/compliance/hipaa-compliance/. AWS서비스에 대한 HITRUST CSF 규정 준수에 대한 자세한 내용은 을 참조하십시오http://aws.amazon.com/compliance/hitrust/. AWS서비스에 대한 다른 규정 준수 프로그램에 대한 자세한 내용은 규정 준수 프로그램별 범위 내AWS 서비스를 참조하십시오.