Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Plugin Apache Hive per l'integrazione di Ranger con Amazon EMR

Modalità Focus
Plugin Apache Hive per l'integrazione di Ranger con Amazon EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache Hive è un motore di esecuzione popolare all'interno dell'ecosistema Hadoop. Amazon EMR fornisce un plug-in Apache Ranger per essere in grado di fornire controlli di accesso granulare per Hive. Il plug-in è compatibile con il server open source Apache Ranger Admin versione 2.0 e successive.

Funzionalità supportate

Il plug-in Apache Ranger per Hive su EMR supporta tutte le funzionalità del plug-in open source, che include database, tabella, controlli di accesso a livello di colonna, filtraggio riga e mascheramento dei dati. Per una tabella dei comandi Hive e delle autorizzazioni Ranger associate, consulta Comandi Hive per la mappatura delle autorizzazioni Ranger.

Installazione della configurazione del servizio

Il plugin Apache Hive è compatibile con la definizione del servizio Hive esistente all'interno di Apache Hive Hadoop SQL.

Definizione del servizio Apache Hive per Hadoop SQL.

Se non disponi di un'istanza del servizio in Hadoop SQL, come mostrato sopra, puoi crearne una. Fai clic sul pulsante + accanto ad Hadoop SQL.

  1. Nome del servizio (se visualizzato): immetti il nome del servizio. Il valore suggerito è amazonemrhive. Prendi nota di questo nome del servizio: è necessario quando si crea una configurazione di sicurezza EMR.

  2. Nome visualizzato: immetti il nome da visualizzare per il servizio. Il valore suggerito è amazonemrhive.

Dettagli del servizio Apache Hive per Hadoop SQL.

Le proprietà di configurazione di Apache Hive vengono utilizzate per stabilire una connessione al server di amministrazione Apache Ranger con un 2 per HiveServer implementare il completamento automatico durante la creazione delle politiche. Non è necessario che le proprietà seguenti siano accurate se non si dispone di un processo HiveServer 2 persistente e possono essere compilate con qualsiasi informazione.

  • Nome utente: inserisci un nome utente per la connessione JDBC a un'istanza di un'istanza HiveServer 2.

  • Password: inserisci la password per il nome utente sopra.

  • jdbc.driver. ClassName: Immettere il nome della classe JDBC per la connettività Apache Hive. Puoi utilizzare il valore predefinito.

  • jdbc.url: Immettere la stringa di connessione JDBC da utilizzare per la connessione a 2. HiveServer

  • Nome comune per certificato: il campo CN all'interno del certificato utilizzato per connettersi al server Admin da un plug-in client. Questo valore deve corrispondere al campo CN nel certificato TLS creato per il plug-in.

Proprietà di configurazione del servizio Apache Hive.

Il pulsante Test Connection verifica se i valori sopra riportati possono essere utilizzati per connettersi correttamente all'istanza 2. HiveServer Una volta che il servizio è stato creato correttamente, il Service Manager dovrebbe avere il seguente aspetto:

Connesso all'istanza HiveServer 2

Considerazioni

Server dei metadati Hive

Il server dei metadati Hive è accessibile solo dai motori attendibili, in particolare Hive e emr_record_server, come misura di protezione da accessi non autorizzati. Il server dei metadati Hive è accessibile anche da tutti i nodi del cluster. La porta 9083 richiesta consente a tutti i nodi di accedere al nodo principale.

Autenticazione

Per impostazione predefinita, Apache Hive è configurato per l'autenticazione tramite Kerberos come configurato nella configurazione di sicurezza EMR. HiveServer2 può essere configurato per autenticare gli utenti anche tramite LDAP. Consulta Implementazione dell'autenticazione LDAP per Hive su un cluster Amazon EMR multi-tenant per maggiori informazioni.

Limitazioni

Di seguito sono riportate le attuali limitazioni per il plug-in Apache Hive su Amazon EMR 5.x:

  • I ruoli Hive non sono attualmente supportati. Le istruzioni Grant (Concedi) e Revoke (Revoca) non sono supportate.

  • La CLI di Hive non è supportata. JDBC/Beeline è l'unico modo autorizzato per connettere Hive.

  • hive.server2.builtin.udf.blacklistla configurazione deve essere compilata con UDFs ciò che ritieni non sicuro.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.