데이터 카탈로그를 Hive 메타스토어에 연결하기 위한 사전 요구 사항 - AWS Lake Formation

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 카탈로그를 Hive 메타스토어에 연결하기 위한 사전 요구 사항

를 외부 Apache Hive 메타스토어에 연결하고 데이터 액세스 권한을 설정하려면 다음 요구 사항을 AWS Glue Data Catalog 완료해야 합니다.

참고

Lake Formation 관리자가 AWS SAM 애플리케이션을 배포하고 권한이 있는 사용자만 Hive 메타스토어 연결을 사용하여 해당 페더레이션 데이터베이스를 생성하는 것이 좋습니다.

  1. IAM 역할을 생성합니다.
    애플리케이션을 배포하려면 AWS SAM
    • Hive 메타스토어에 대한 연결을 생성하는 데 필요한 리소스 (Lambda 함수Amazon API Gateway, IAM 역할, 연결) 를 배포하는 데 필요한 권한이 있는 역할을 생성합니다. AWS Glue

    페더레이션된 데이터베이스를 만들려면

    다음과 같은 리소스에 대한 권한이 필요합니다.

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Amazon S3 위치를 레이크 포메이션에 등록하십시오.

    Lake Formation을 사용하여 데이터 레이크의 데이터를 관리하고 보호하려면 Hive 메타스토어의 테이블 데이터가 있는 Amazon S3 위치를 Lake Formation에 등록해야 합니다. 이는 Lake Formation이 Athena, Redshift Spectrum 및 Amazon EMR과 같은 AWS 분석 서비스에 자격 증명을 제공할 수 있도록 하기 위한 것입니다.

    Amazon S3 위치 등록에 대한 자세한 내용은 을 참조하십시오데이터 레이크에 Amazon S3 위치 추가.

    Amazon S3 위치를 등록할 때 데이터 카탈로그 페더레이션 활성화 확인란을 선택하면 Lake Formation이 페더레이션 데이터베이스의 테이블에 액세스하는 역할을 맡을 수 있습니다.

    Lake Formation에 데이터 위치를 등록하는 방법에 대한 자세한 내용은 을 참조하십시오데이터 레이크를 위한 Amazon S3 위치를 구성합니다..

  3. 아마존 EMR 버전 요구 사항

    페더레이션된 Hive 메타스토어 데이터베이스와 함께 Amazon EMR을 사용하려면 Hive 버전 3.x 이상 및 Amazon EMR 버전 6.x 이상이 있어야 합니다.