Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Apache Hive è un motore di esecuzione popolare all'interno dell'ecosistema Hadoop. Amazon EMR fornisce un plug-in Apache Ranger per essere in grado di fornire controlli di accesso granulare per Hive. Il plug-in è compatibile con il server open source Apache Ranger Admin versione 2.0 e successive.
Argomenti
Funzionalità supportate
Il plug-in Apache Ranger per Hive su EMR supporta tutte le funzionalità del plug-in open source, che include database, tabella, controlli di accesso a livello di colonna, filtraggio riga e mascheramento dei dati. Per una tabella dei comandi Hive e delle autorizzazioni Ranger associate, consulta Comandi Hive per la mappatura delle autorizzazioni Ranger
Installazione della configurazione del servizio
Il plugin Apache Hive è compatibile con la definizione del servizio Hive esistente all'interno di Apache Hive Hadoop SQL.

Se non disponi di un'istanza del servizio in Hadoop SQL, come mostrato sopra, puoi crearne una. Fai clic sul pulsante + accanto ad Hadoop SQL.
-
Nome del servizio (se visualizzato): immetti il nome del servizio. Il valore suggerito è
amazonemrhive
. Prendi nota di questo nome del servizio: è necessario quando si crea una configurazione di sicurezza EMR. -
Nome visualizzato: immetti il nome da visualizzare per il servizio. Il valore suggerito è
amazonemrhive
.

Le proprietà di configurazione di Apache Hive vengono utilizzate per stabilire una connessione al server di amministrazione Apache Ranger con un 2 per HiveServer implementare il completamento automatico durante la creazione delle politiche. Non è necessario che le proprietà seguenti siano accurate se non si dispone di un processo HiveServer 2 persistente e possono essere compilate con qualsiasi informazione.
-
Nome utente: inserisci un nome utente per la connessione JDBC a un'istanza di un'istanza HiveServer 2.
-
Password: inserisci la password per il nome utente sopra.
-
jdbc.driver. ClassName: Immettere il nome della classe JDBC per la connettività Apache Hive. Puoi utilizzare il valore predefinito.
-
jdbc.url: Immettere la stringa di connessione JDBC da utilizzare per la connessione a 2. HiveServer
-
Nome comune per certificato: il campo CN all'interno del certificato utilizzato per connettersi al server Admin da un plug-in client. Questo valore deve corrispondere al campo CN nel certificato TLS creato per il plug-in.

Il pulsante Test Connection verifica se i valori sopra riportati possono essere utilizzati per connettersi correttamente all'istanza 2. HiveServer Una volta che il servizio è stato creato correttamente, il Service Manager dovrebbe avere il seguente aspetto:

Considerazioni
Server dei metadati Hive
Il server dei metadati Hive è accessibile solo dai motori attendibili, in particolare Hive e emr_record_server
, come misura di protezione da accessi non autorizzati. Il server dei metadati Hive è accessibile anche da tutti i nodi del cluster. La porta 9083 richiesta consente a tutti i nodi di accedere al nodo principale.
Autenticazione
Per impostazione predefinita, Apache Hive è configurato per l'autenticazione tramite Kerberos come configurato nella configurazione di sicurezza EMR. HiveServer2 può essere configurato per autenticare gli utenti anche tramite LDAP. Consulta Implementazione dell'autenticazione LDAP per Hive su un cluster Amazon EMR multi-tenant
Limitazioni
Di seguito sono riportate le attuali limitazioni per il plug-in Apache Hive su Amazon EMR 5.x:
-
I ruoli Hive non sono attualmente supportati. Le istruzioni Grant (Concedi) e Revoke (Revoca) non sono supportate.
-
La CLI di Hive non è supportata. JDBC/Beeline è l'unico modo autorizzato per connettere Hive.
-
hive.server2.builtin.udf.blacklist
la configurazione deve essere compilata con UDFs ciò che ritieni non sicuro.