Utilizzo di Hue con un database remoto in Amazon RDS - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Hue con un database remoto in Amazon RDS

Per impostazione predefinita, le informazioni utente Hue e le cronologie delle query vengono archiviate in un database MySQL locale sul nodo master. In alternativa, puoi creare uno o più cluster abilitati Hue utilizzando una configurazione archiviata in Amazon S3 e un database MySQL in Amazon Relational Database Service (Amazon RDS). In questo modo puoi preservare le informazioni utente e la cronologia delle query create da Hue senza mantenere il cluster Amazon EMR in esecuzione. Ti consigliamo di usare la crittografia lato server Amazon S3 per archiviare il file di configurazione.

Crea innanzitutto il database remoto per Hue.

Creazione del database MySQL esterno
  1. Apri la console di Amazon RDS all'indirizzo https://console.aws.amazon.com/rds/.

  2. Fare clic su Launch a DB Instance (Avvia un'istanza database).

  3. Scegliere MySQL e fare clic su Select (Seleziona).

  4. Lasciare la selezione predefinita di Multi-AZ Deployment and Provisioned IOPS Storage (Implementazione Multi-AZ e storage IOPS assegnato) e fare clic su Next (Successivo).

  5. Lasciare le impostazioni predefinite per Instance Specifications (Specifiche delle istanze), specificare Settings (Impostazioni) e fare clic su Next (Successivo).

  6. Nella pagina Configure Advanced Settings (Configura impostazioni avanzate), scegliere un gruppo di sicurezza e un nome del database adeguati. Il gruppo di sicurezza utilizzato deve consentire almeno l'accesso TCP in entrata per porta 3306 dal nodo master del cluster. Se a questo punto il cluster non è ancora stato creato, puoi consentire a tutti gli host di connettersi alla porta 3306 e modificare il gruppo di sicurezza dopo che il cluster è stato avviato. Fare clic su Launch DB Instance (Avvia istanza database).

  7. Dal pannello di controllo RDS, scegliere Instances (Istanze) e selezionare l'istanza appena creata. Quando il database è disponibile, prendere nota di nomedb, nome utente, password e nome host dell'istanza RDS. Utilizzare questa informazione quando si crea e configura il cluster.

Per specificare un database MySQL esterno per Hue all'avvio di un cluster utilizzando AWS CLI

Per specificare un database MySQL esterno per Hue all'avvio di un cluster utilizzando il, usa le informazioni che hai annotato durante AWS CLI la creazione dell'istanza RDS per la configurazione con un oggetto di configurazione hue.ini

Nota

Puoi creare più cluster che utilizzano lo stesso database esterno, ma ogni cluster condividerà la cronologia delle query e le informazioni utente.

  • Utilizzando AWS CLI, create un cluster con Hue installato, utilizzando il database esterno creato e facendo riferimento a un file di configurazione con una classificazione di configurazione per Hue che specifica le proprietà del database. L'esempio seguente consente di creare un cluster con Hue installato, facendo riferimento a un file di configurazione in Amazon S3, myConfig.json, che specifica la configurazione del database.

    Nota

    I caratteri di continuazione della riga Linux (\) sono inclusi per la leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuoverli o sostituirli con un accento circonflesso (^).

    aws emr create-cluster --release-label emr-7.1.0 --applications Name=Hue Name=Spark Name=Hive \ --instance-type m5.xlarge --instance-count 3 \ --configurations https://s3.amazonaws.com/mybucket/myfolder/myConfig.json --use-default-roles

    Contenuti di esempio del file myConfig.json sono mostrati di seguito. Sostituisci dbname, nome utente, password e nome host dell'istanza RDS con i valori annotati in precedenza nel pannello di controllo RDS.

    [{ "Classification": "hue-ini", "Properties": {}, "Configurations": [ { "Classification": "desktop", "Properties": {}, "Configurations": [ { "Classification": "database", "Properties": { "name": "dbname", "user": "username", "password": "password", "host": "RDS instance hostname", "port": "3306", "engine": "mysql" }, "Configurations": [] } ] } ] }]

Risoluzione dei problemi

In caso di failover di Amazon RDS

Durante l'esecuzione di una query si possono verificare ritardi perché l'istanza del database Hue non risponde o è in corso di esecuzione un failover. Di seguito sono elencati alcuni fatti e linee guida per questo problema:

  • Se esegui l'accesso alla console Amazon RDS, puoi cercare gli eventi di failover. Ad esempio, per vedere se un failover è in corso o si è verificato, cerca eventi quali "Multi-AZ instance failover started" e "Multi-AZ instance failover completed".

  • Un'istanza RDS impiega circa 30 secondi per completare un failover.

  • Se ricevi longer-than-normal risposte alle query in Hue, prova a rieseguire la query.