Tutorial: Utilizzo di Amazon DynamoDB e Apache Hive

In questo tutorial, viene avviato un cluster Amazon EMR e quindi si utilizza Apache Hive per elaborare i dati archiviati in una tabella DynamoDB.

Hive è un'applicazione di data warehouse per Hadoop che consente di elaborare e analizzare i dati da più origini. Hive fornisce un linguaggio simile a SQL, HiveQL, che consente di lavorare con i dati archiviati in locale nel cluster Amazon EMR o in un'origine dati esterna (ad esempio Amazon DynamoDB).

Per maggiori informazioni, vedi il tutorial Hive.

Argomenti

Prima di iniziare

Per questo tutorial hai bisogno dei seguenti elementi:

Un AWS account. Se non lo hai, consulta Iscrizione a AWS.
Un client SSH (Secure Shell). È possibile utilizzare il client SSH per connettersi al nodo principale del cluster Amazon EMR ed eseguire comandi interattivi. I client SSH sono disponibili per impostazione predefinita nella maggior parte delle installazioni Linux, Unix e Mac OS X. Gli utenti Windows possono scaricare e installare il client PuTTY, che ha il supporto SSH.

Approfondimenti

Fase 1: creare una coppia di EC2 chiavi Amazon

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Integrazione con Amazon EMR

Fase 1: creare una coppia di EC2 chiavi Amazon