Didacticiel : Utilisation d’Amazon DynamoDB et d’Apache Hive

Dans ce didacticiel, vous allez lancer un cluster Amazon EMR, puis utiliser Apache Hive pour traiter les données stockées dans une table DynamoDB.

Hive est une application d’entrepôt de données pour Hadoop, qui vous permet de traiter et d’analyser des données de plusieurs sources. Hive fournit un langage similaire à SQL, HiveQL, qui vous permet d’utiliser des données stockées localement dans le cluster Amazon EMR ou dans une source de données externe (telle qu’Amazon DynamoDB).

Pour plus d’informations, consultez le Didacticiel Hive.

Rubriques

Avant de commencer

Pour ce didacticiel, vous avez besoin des éléments suivants :

Un compte AWS. Si vous n’en avez pas, consultez Inscription à AWS.
Un client SSH (Secure Shell). Vous utilisez le client SSH pour vous connecter au nœud leader du cluster Amazon EMR et exécuter des commandes interactives. Les clients SSH sont disponibles par défaut sur la plupart des installations Linux, Unix et Mac OS X. Les utilisateurs de Windows peuvent télécharger et installer le client PuTTY qui prend en charge SSH.

Étape suivante

Étape 1 : Créer une paire de clés Amazon EC2

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Intégration avec Amazon EMR

Étape 1 : Créer une paire de clés Amazon EC2