Integre a Amazon EMR com o Apache Ranger - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integre a Amazon EMR com o Apache Ranger

A partir do Amazon EMR 5.32.0, você pode iniciar um cluster que se integra nativamente com o Apache Ranger. O Apache Ranger é uma estrutura de código aberto para habilitar, monitorar e gerenciar uma segurança de dados abrangente em toda a plataforma Hadoop. Para obter mais informações, consulte Apache Ranger. Com a integração nativa, você pode trazer seu próprio Apache Ranger para impor um controle refinado de acesso aos dados na Amazon. EMR

Esta seção fornece uma visão geral conceitual da EMR integração da Amazon com o Apache Ranger. Também inclui os pré-requisitos e as etapas necessárias para iniciar um EMR cluster da Amazon integrado ao Apache Ranger.

A integração nativa da Amazon EMR com o Apache Ranger oferece os seguintes benefícios principais:

  • Controle de acesso refinado aos bancos de dados e tabelas do Hive Metastore, que permite definir políticas de filtragem de dados no nível de banco de dados, tabela e coluna para aplicações Apache Spark e Apache Hive. A filtragem em nível de linha e o mascaramento de dados são compatíveis com aplicações Hive.

  • A capacidade de usar suas políticas existentes do Hive diretamente com os aplicativos Amazon EMR for Hive.

  • Controle de acesso aos dados do Amazon S3 no nível do prefixo e do objeto, o que permite definir políticas de filtragem de dados para acesso aos dados do S3 usando o sistema de arquivos. EMR

  • A capacidade de usar o CloudWatch Logs para auditoria centralizada.

  • A Amazon EMR instala e gerencia os plug-ins do Apache Ranger em seu nome.