EMRAmazon을 다음과 통합하세요 AWS Lake Formation - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

EMRAmazon을 다음과 통합하세요 AWS Lake Formation

AWS Lake Formation Amazon Simple Storage Service (S3) 데이터 레이크에서 데이터를 검색, 분류, 정리 및 보호하는 데 도움이 되는 관리형 서비스입니다. Lake Formation은 Glue 데이터 카탈로그의 데이터베이스 및 테이블에 대한 세밀한 열 수준의 액세스를 제공합니다. AWS 자세한 내용은 AWS Lake Formation란 무엇입니까?를 참조하십시오.

Amazon EMR 릴리스 6.7.0 이상에서는 Amazon 클러스터에 제출하는 Spark, Hive 및 Presto 작업에 Lake Formation 기반 액세스 제어를 적용할 수 있습니다. EMR Lake Formation과 통합하려면 런타임 역할이 있는 EMR 클러스터를 생성해야 합니다. 런타임 역할은 Amazon EMR 작업 또는 쿼리에 연결하는 AWS Identity and Access Management (IAM) 역할입니다. EMR그러면 Amazon은 이 역할을 사용하여 AWS 리소스에 액세스합니다. 자세한 내용은 Amazon EMR 스텝의 런타임 역할 단원을 참조하십시오.

아마존이 레이크 포메이션과 협력하는 EMR 방식

Amazon을 Lake EMR Formation과 통합한 후에는 스튜디오를 StepAPI사용하거나 SageMaker 스튜디오를 사용하여 Amazon EMR 클러스터에 쿼리를 실행할 수 있습니다. 그런 다음 Lake Formation은 Amazon의 임시 자격 증명을 통해 데이터에 대한 액세스를 제공합니다EMR. 이 프로세스를 보안 인증 벤딩이라고 합니다. 자세한 내용은 AWS Lake Formation란 무엇입니까?를 참조하십시오.

다음은 EMR Amazon이 Lake Formation 보안 정책으로 보호되는 데이터에 액세스하는 방법에 대한 개괄적인 개요입니다.

Amazon이 Lake Formation 보안 정책으로 보호되는 데이터에 EMR 액세스하는 방법
  1. 사용자가 Lake Formation의 데이터에 대한 Amazon EMR 쿼리를 제출합니다.

  2. Amazon은 사용자에게 데이터 액세스 권한을 부여하기 위해 Lake Formation에 임시 자격 증명을 EMR 요청합니다.

  3. Lake Formation은 임시 보안 인증을 반환합니다.

  4. Amazon은 Amazon S3에서 데이터를 검색하기 위해 쿼리 요청을 EMR 보냅니다.

  5. Amazon은 Amazon S3로부터 데이터를 EMR 수신하여 필터링하고 사용자가 Lake Formation에서 정의한 사용자 권한을 기반으로 결과를 반환합니다.

Lake Formation 정책에 사용자 및 그룹을 추가하는 방법에 대한 자세한 내용은 Granting Data Catalog permissions를 참조하세요.

사전 조건

EMRAmazon과 Lake Formation을 통합하려면 먼저 다음 요구 사항을 충족해야 합니다.

  • Amazon EMR 클러스터에서 런타임 역할 인증을 활성화합니다.

  • AWS Glue 데이터 카탈로그를 메타데이터 저장소로 사용합니다.

  • Lake Formation에서 AWS Glue Data Catalog의 데이터베이스, 테이블 및 열에 액세스할 수 있는 권한을 정의하고 관리합니다. 자세한 내용은 AWS Lake Formation란 무엇입니까?를 참조하십시오.