기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon AWS Lake Formation Athena와 함께 사용
Amazon Athena는 Amazon S3에 저장된 정형, 반정형 및 비정형 데이터를 분석할 수 있는 서버리스 쿼리 서비스입니다. Athena는 CSV, JSON, Parquet 및 Avro 데이터 형식의 데이터 쿼리를 지원합니다. Athena는 아파치 하이브, 아파치 후디, 아파치
다음은 Athena와 함께 Lake Formation을 사용할 수 있는 몇 가지 일반적인 사용 사례입니다.
Lake Formation 권한을 사용하여 Athena에서 데이터 카탈로그 리소스 (데이터베이스 및 테이블) 에 액세스할 수 있습니다. 명명된 리소스 메서드 또는 LF-태그를 사용하여 데이터베이스 및 테이블에 대한 권한을 정의할 수 있습니다. 자세한 내용은 다음을 참조하세요.
Lake Formation 권한은 데이터베이스와 테이블에 대한 읽기 및 쓰기 작업을 모두 지원합니다.
참고
LF-태그를 사용하여 Data Catalog 리소스에 대한 권한을 관리하는 경우 데이터 필터를 적용할 수 없습니다.
열, 행 및 셀 수준에서 권한을 부여하여 Amazon S3 데이터 레이크의 테이블을 보호하는 데 사용하여 Lake Formation 포메이션의 데이터 필터 쿼리 결과를 제어합니다. Amazon Athena 사용 설명서의 파티션 프로젝션 제한 사항을 참조하십시오.
통합 쿼리를 실행할 때 SAML 기반 Athena 사용자가 사용할 수 있는 데이터에 대해 세밀한 액세스 제어를 적용합니다.
Athena JDBC 및 ODBC 드라이버는 SAML 기반 ID 공급자 (IdP) 를 사용하여 데이터 원본에 대한 페더레이션 액세스를 구성할 수 있도록 지원합니다. Lake QuickSight Formation과 통합된 Amazon을 기존 IAM 역할 또는 SAML 사용자 또는 그룹과 함께 사용하여 Athena 쿼리 결과를 시각화하십시오.
참고
SAML 사용자 및 그룹에 대한 Lake Formation 권한은 JDBC 또는 ODBC 드라이버를 사용하여 Athena에 쿼리를 제출할 때만 적용됩니다.
자세한 내용은 Athena에 대한 페더레이션 액세스를 위한 Lake Formation, Athena JDBC 및 ODBC 드라이버 사용을 참조하십시오.
참고
현재 Lake Formation의 SAML ID에 대한 액세스 권한 부여는 다음 지역에서 지원되지 않습니다.
-
중동 (바레인) - me-south-1
-
아시아 태평양 (홍콩) - 동부-1
-
아프리카 (케이프타운) - AF-사우스-1
-
중국 (닝샤) - cn-노스웨스트-1
-
아시아 태평양 (오사카) - AP-북동부-3
-
다른 계정의 테이블을 Lake Formation의 계정 간 데이터 공유 쿼리하는 데 사용합니다.
참고
Lake Formation 권한을 사용할 때의 제한 사항에 Views
대한 자세한 내용은 고려 사항 및 제한을 참조하십시오.
트랜잭션 테이블 형식 지원
Lake Formation 권한을 적용하면 Amazon S3 기반 데이터 레이크의 트랜잭션 데이터를 보호할 수 있습니다. 아래 표에는 Athena에서 지원되는 트랜잭션 테이블 형식과 Lake Formation 권한이 나와 있습니다. Lake Formation은 Athena 사용자가 쿼리를 실행할 때 이러한 권한을 적용합니다.
테이블 형식 | 설명 및 허용된 작업 | Athena에서 지원되는 Lake Formation 권한 |
---|---|---|
Apache Hudi |
증분 데이터 처리 및 데이터 파이프라인 개발을 단순화하는 데 사용되는 형식입니다. Athena는 Amazon S3 데이터 세트에서 쓰기 시 복사 (CoW) 및 읽기 시 병합 (MoR) Hudi 테이블 유형 모두에 대해 Apache Hudi 테이블 형식을 사용한 생성 및 읽기 작업을 지원합니다. Athena는 Hudi 테이블에 대한 쓰기 작업을 지원하지 않습니다. |
표, 열, 행 및 셀 수준 권한을 사용하여 Hudi 테이블을 보호하는 데 사용합니다Lake Formation 포메이션의 데이터 필터링 및 셀 수준 보안. |
Apache Iceberg |
대규모 파일 컬렉션을 테이블로 관리하고 레코드 수준의 삽입, 업데이트, 삭제 및 시간 여행 쿼리와 같은 최신 분석 데이터 레이크 작업을 지원하는 개방형 테이블 형식입니다. |
표, 열, 행 및 셀 수준 권한이 지원됩니다. 현재 Lake Formation은 쓰기 작업 (예: |
Linux Foundation Delta Lake |
Delta Lake는 Amazon S3 또는 하둡 분산 파일 시스템 (HDFS) 에 일반적으로 구축되는 최신 데이터 레이크 아키텍처를 구현하는 데 도움이 되는 오픈 소스 프로젝트입니다. Athena는 Delta Lake 테이블에서 심볼릭 링크 기반 매니페스트 테이블 정의를 사용하여 만든 Delta lake 테이블을 지원합니다. AWS Glue Data Catalog 자세한 내용은 크롤러를 사용한 델타 레이크 테이블 크롤링을 Athena (엔진 버전 3) 는 네이티브 델타 레이크 테이블 읽기를 지원합니다. 자세한 내용은 AWS Glue크롤러를 통한 네이티브 Delta Lake 테이블 지원 소개를 |
심볼릭 링크 테이블에는 테이블, 열, 행 및 셀 수준 권한이 지원됩니다. 네이티브 델타 레이크 테이블에는 Lake Formation 통합을 사용할 수 없습니다. |