Funzionalità supportate Installazione della configurazione del servizio Considerazioni Limitazioni

Plugin Apache Hive per l'integrazione di Ranger con Amazon EMR

Apache Hive è un motore di esecuzione popolare all'interno dell'ecosistema Hadoop. Amazon EMR fornisce un plug-in Apache Ranger per essere in grado di fornire controlli di accesso granulare per Hive. Il plug-in è compatibile con il server open source Apache Ranger Admin versione 2.0 e successive.

Argomenti

Funzionalità supportate
Installazione della configurazione del servizio
Considerazioni
Limitazioni

Funzionalità supportate

Il plug-in Apache Ranger per Hive su EMR supporta tutte le funzionalità del plug-in open source, che include database, tabella, controlli di accesso a livello di colonna, filtraggio riga e mascheramento dei dati. Per una tabella dei comandi Hive e delle autorizzazioni Ranger associate, consulta Comandi Hive per la mappatura delle autorizzazioni Ranger.

Installazione della configurazione del servizio

Il plugin Apache Hive è compatibile con la definizione del servizio Hive esistente all'interno di Apache Hive Hadoop SQL.

Definizione del servizio Apache Hive per Hadoop SQL.

Se non disponi di un'istanza del servizio in Hadoop SQL, come mostrato sopra, puoi crearne una. Fai clic sul pulsante + accanto ad Hadoop SQL.

Nome del servizio (se visualizzato): immetti il nome del servizio. Il valore suggerito è amazonemrhive. Prendi nota di questo nome del servizio: è necessario quando si crea una configurazione di sicurezza EMR.
Nome visualizzato: immetti il nome da visualizzare per il servizio. Il valore suggerito è amazonemrhive.

Dettagli del servizio Apache Hive per Hadoop SQL.

Le proprietà di configurazione di Apache Hive vengono utilizzate per stabilire una connessione al server di amministrazione Apache Ranger con un 2 per HiveServer implementare il completamento automatico durante la creazione delle politiche. Non è necessario che le proprietà seguenti siano accurate se non si dispone di un processo HiveServer 2 persistente e possono essere compilate con qualsiasi informazione.

Nome utente: inserisci un nome utente per la connessione JDBC a un'istanza di un'istanza HiveServer 2.
Password: inserisci la password per il nome utente sopra.
jdbc.driver. ClassName: Immettere il nome della classe JDBC per la connettività Apache Hive. Puoi utilizzare il valore predefinito.
jdbc.url: Immettere la stringa di connessione JDBC da utilizzare per la connessione a 2. HiveServer
Nome comune per certificato: il campo CN all'interno del certificato utilizzato per connettersi al server Admin da un plug-in client. Questo valore deve corrispondere al campo CN nel certificato TLS creato per il plug-in.

Proprietà di configurazione del servizio Apache Hive.

Il pulsante Test Connection verifica se i valori sopra riportati possono essere utilizzati per connettersi correttamente all'istanza 2. HiveServer Una volta che il servizio è stato creato correttamente, il Service Manager dovrebbe avere il seguente aspetto:

Considerazioni

Server dei metadati Hive

Il server dei metadati Hive è accessibile solo dai motori attendibili, in particolare Hive e emr_record_server, come misura di protezione da accessi non autorizzati. Il server dei metadati Hive è accessibile anche da tutti i nodi del cluster. La porta 9083 richiesta consente a tutti i nodi di accedere al nodo principale.

Autenticazione

Per impostazione predefinita, Apache Hive è configurato per l'autenticazione tramite Kerberos come configurato nella configurazione di sicurezza EMR. HiveServer2 può essere configurato per autenticare gli utenti anche tramite LDAP. Consulta Implementazione dell'autenticazione LDAP per Hive su un cluster Amazon EMR multi-tenant per maggiori informazioni.

Limitazioni

Di seguito sono riportate le attuali limitazioni per il plug-in Apache Hive su Amazon EMR 5.x:

I ruoli Hive non sono attualmente supportati. Le istruzioni Grant (Concedi) e Revoke (Revoca) non sono supportate.
L'interfaccia CLI di Hive non è supportata. JDBC/Beeline è l'unico modo autorizzato per connettere Hive.
hive.server2.builtin.udf.blacklistla configurazione deve essere compilata con UDFs ciò che ritieni non sicuro.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Plugin Apache Ranger per scenari di integrazione Amazon EMR

Plugin Apache Spark per l'integrazione di Ranger con Amazon EMR