将亚马逊EMR与 Apache Ranger 集成 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将亚马逊EMR与 Apache Ranger 集成

从 Amazon EMR 5.32.0 开始,您可以启动与 Apache Ranger 原生集成的集群。Apache Ranger 是一个开源框架,可跨 Hadoop 平台启用、监控和管理全面的数据安全。有关更多信息,请参阅 Apache Ranger。通过原生集成,您可以自带Apache Ranger来在亚马逊上实施精细的数据访问控制。EMR

本节从概念上概述了亚马逊与 Apache Ranger 的EMR集成。它还包括启动与 Apache Rang EMR er 集成的亚马逊集群所需的先决条件和步骤。

将亚马逊EMR与 Apache Ranger 原生集成可带来以下主要好处:

  • 对 Hive 元存储数据库和表的精细访问控制,使您能够为 Apache Spark 和 Apache Hive 应用程序在数据库、表和列级别定义数据筛选策略。Hive 应用程序支持行级过滤和数据屏蔽。

  • 能够直接将现有 Hive 策略与 Amazon for Hive EMR 应用程序配合使用。

  • 在前缀和对象级别对 Amazon S3 数据的访问控制,这使您能够使用EMR文件系统定义用于访问 S3 数据的数据筛选策略。

  • 能够使用 CloudWatch 日志进行集中审计。

  • 亚马逊代表你EMR安装和管理 Apache Ranger 插件。