Didacticiel : Utilisation d’Amazon DynamoDB et d’Apache Hive - Amazon DynamoDB

Didacticiel : Utilisation d’Amazon DynamoDB et d’Apache Hive

Dans ce didacticiel, vous allez lancer un cluster Amazon EMR, puis utiliser Apache Hive pour traiter les données stockées dans une table DynamoDB.

Hive est une application d’entrepôt de données pour Hadoop, qui vous permet de traiter et d’analyser des données de plusieurs sources. Hive fournit un langage similaire à SQL, HiveQL, qui vous permet d’utiliser des données stockées localement dans le cluster Amazon EMR ou dans une source de données externe (telle qu’Amazon DynamoDB).

Pour plus d’informations, consultez le Didacticiel Hive.

Avant de commencer

Pour ce didacticiel, vous avez besoin des éléments suivants :

  • Un compte AWS. Si vous n’en avez pas, consultez Inscription à AWS.

  • Un client SSH (Secure Shell). Vous utilisez le client SSH pour vous connecter au nœud leader du cluster Amazon EMR et exécuter des commandes interactives. Les clients SSH sont disponibles par défaut sur la plupart des installations Linux, Unix et Mac OS X. Les utilisateurs de Windows peuvent télécharger et installer le client PuTTY qui prend en charge SSH.

Étape suivante

Étape 1 : Créer une paire de clés Amazon EC2