기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
아마존 AWS Lake Formation EMR과 함께 사용
Amazon EMR은 Hadoop Map-Reduce, Spark, Hive, Presto 등과 같은 지원되는 빅 데이터 프레임워크에서 모든 사용자 지정 코드를 실행할 수 있는 유연한 AWS 관리형 클러스터 플랫폼입니다. 또한 조직은 Amazon EMR을 사용하여 고도로 분산된 클러스터에서 배치 및 스트리밍 데이터 처리 애플리케이션을 모두 실행합니다. Amazon EMR을 사용하면 Lake Formation에서 권한을 관리하는 데이터베이스 및 테이블에서 데이터 변환 및 사용자 지정 코드를 실행할 수 있습니다.
Amazon EMR을 배포하기 위한 세 가지 옵션은 다음과 같습니다.
-
EMR on EC2
-
EMR Serverless
-
EKS의 EMR
Lake Formation 통합은 아마존 EC2의 아마존 EMR을 통해서만 사용할 수 있습니다. Lake Formation은 다음 방법을 사용하여 Amazon EC2의 아마존 EMR과 통합됩니다.
-
Lake Formation을 사용하면 Amazon EMR 런타임 역할을 기반으로 데이터 레이크에 대한 액세스를 관리하여 사용자가 Spark 및 Hive 작업을 Step API를 통해 Amazon EMR 클러스터에 Spark 및 Hive 작업을 제출할 수 있습니다. 이 방법에서 지원하는 작업 유형은 추가 고려 사항에 나열되어 있습니다.
참고
이 방법은 데이터 필터 사용을 지원하지 않습니다.
자세한 내용은 Amazon EMR과 Lake Formation의 통합을 참조하십시오.
트랜잭션 테이블 형식 지원
Amazon EMR은 아파치 후디, 아파치아이스버그 및 델타 레이크 테이블 형식을 지원합니다.
자세한 내용은 아파치 후디 및 레이크 포메이션 문서를 참조하십시오.
Lake Formation 권한은 현재 아파치 아이스버그 및 리눅스 파운데이션의 델타 레이크 테이블에서는 지원되지 않습니다.