Amazon EMR Studio - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EMR Studio

Amazon EMR 클러스터에서 실행되는 완전관리형 Jupyter 노트북을 위한 웹 기반 통합 개발 환경 (IDE) 입니다. 팀이 R, Python, Scala 및 로 작성된 애플리케이션을 개발, 시각화 및 디버그할 수 있도록 EMR Studio를 설정할 수 있습니다. PySpark. EMR 스튜디오는 다음과 통합되어 있습니다.AWS Identity and Access Management(IAM) 및 IAM ID 센터를 통해 사용자는 회사 자격 증명을 사용하여 로그인할 수 있습니다.

EMR Studio는 무료로 만들 수 있습니다. EMR Studio를 사용할 때 Amazon S3 스토리지 및 Amazon EMR 클러스터에 적용되는 요금이 적용됩니다. 제품 세부 정보 및 하이라이트는 서비스 페이지를 참조하십시오.Amazon EMR Studio.

EMR 스튜디오의 주요 기능

Amazon EMR Studio는 다음의 기능을 제공합니다.

  • 를 사용하여 사용자 인증AWS Identity and Access Management(Iam) 또는AWS IAM Identity Center (successor to AWS Single Sign-On)(IAM Identity Center) 및 엔터프라이즈 자격 증명 공급자.

  • 필요에 따라 Amazon EMR 클러스터에 액세스하고 시작하여 Jupyter 노트북 작업을 실행합니다.

  • EKS 클러스터의 Amazon EMR에 Connect 작업 실행 시 작업을 제출합니다.

  • 예제 노트북을 탐색하고 저장하세요. 예제 Notebook에 대한 자세한 정보는 섹션을 참조하세요.EMR Studio 노트북 예제 GitHub 저장소.

  • Python을 사용하여 데이터를 PySpark, 스파크 스칼라, 스파크 R 또는 SparkSQL을 실행하고 사용자 지정 커널 및 라이브러리를 설치합니다.

  • 동일한 Workspace에서 다른 사용자와 실시간으로 협업할 수 있습니다. 자세한 정보는 워크스페이스 협업 구성을 참조하세요.

  • 노트북에서 데이터를 사용하기 전에 EMR Studio SQL 탐색기를 사용하여 데이터 카탈로그를 검색하고 SQL 쿼리를 실행하고 결과를 다운로드할 수 있습니다.

  • Apache Airflow나 Apache Airflow용 Amazon 관리형 워크플로와 같은 오케스트레이션 도구를 사용하여 스케줄링된 워크플로의 일부로 매개변수화된 노트북을 실행합니다. 자세한 내용을 알아보려면 다음 섹션을 참조하세요.MWAA를 사용하여 EMR Notebooks 노트북의 분석 작업 조율에서AWS빅데이터 블로그.

  • 링크 코드 리포지토리 (예:) GitHub 과 BitBucket.

  • Spark 히스토리 서버, Tez UI 또는 YARN 타임라인 서버를 사용하여 작업을 추적하고 디버그하세요.

EMR 스튜디오는 또한 HIPAA 자격을 갖추고 있으며 HITRUST CSF 및 SOC 2에 따라 인증을 받았습니다. HIPAA 규정 준수에 대한 자세한 내용은 를 참조하십시오.AWS서비스, 참조http://aws.amazon.com/compliance/hipaa-compliance/. 의 HITRUST CSF 규정 준수에 대한 자세한 내용은AWS서비스, 참조http://aws.amazon.com/compliance/hitrust/. 기타 규정 준수 프로그램에 대한 자세한 내용은AWS서비스, 참조AWS규정 준수 프로그램 제공 범위 내 서비스.