HBasespécificités de l'application pour AMI les versions antérieures d'Amazon EMR - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

HBasespécificités de l'application pour AMI les versions antérieures d'Amazon EMR

HBaseVersions prises en charge

HBaseversion AMIversion AWS CLI paramètres de configuration HBasedétails de la version
0.94.18 3.1.0 et ultérieures

--ami-version 3.1

--ami-version 3.2

--ami-version 3.3

--applications Name=HBase

  • Correctifs de bogues et améliorations

0.94.7 3.0-3.0.4

--ami-version 3.0

--applications Name=HBase

0.92 2.2 et ultérieures

--ami-version 2.2 or later

--applications Name=HBase

HBaseprérequis du cluster

Un cluster créé à l'aide des EMR AMI versions 2.x et 3.x d'Amazon doit répondre aux exigences suivantes pour. HBase

  • Le AWS CLI (facultatif) —Pour interagir à HBase l'aide de la ligne de commande, téléchargez et installez la dernière version du AWS CLI. Pour plus d’informations, consultez Installation d’ AWS Command Line Interface dans le Guide de l’utilisateur AWS Command Line Interface .

  • Au moins deux instances (facultatif) : le nœud principal du cluster exécute le serveur HBase principal et Zookeeper, et les nœuds de tâches exécutent les serveurs HBase régionaux. Pour de meilleures performances, les HBase clusters doivent s'exécuter sur au moins deux EC2 instances, mais vous pouvez les exécuter HBase sur un seul nœud à des fins d'évaluation.

  • Cluster de longue durée : HBase ne s'exécute que sur des clusters de longue durée. Par défaut, la EMR console CLI et Amazon créent des clusters de longue durée.

  • Un jeu de paires de EC2 clés Amazon (recommandé) : pour utiliser le protocole réseau Secure Shell (SSH) pour vous connecter au nœud principal et exécuter des commandes HBase shell, vous devez utiliser une paire de EC2 clés Amazon lors de la création du cluster.

  • Versions correctes AMI et Hadoop : les HBase clusters ne sont actuellement pris en charge que sur Hadoop 20.205 ou version ultérieure.

  • Ganglia (facultatif) : pour surveiller les indicateurs de HBase performance, installez Ganglia lors de la création du cluster.

  • Un compartiment Amazon S3 pour les journaux (facultatif) : les journaux pour HBase sont disponibles sur le nœud principal. Si vous voulez que ces journaux soient copiés dans Amazon S3, spécifiez un compartiment S3 qui contiendra les fichiers journaux lorsque vous créez le cluster.

Création d'un cluster avec HBase

Le tableau suivant répertorie les options disponibles lorsque vous utilisez la console pour créer un cluster à HBase l'aide d'une EMR AMI version publiée par Amazon.

Champ Action
Restore from backup (Rétablir à partir d'une sauvegarde) Spécifiez s'il faut précharger le HBase cluster avec les données stockées dans Amazon S3.
Backup location (Emplacement de sauvegarde) Spécifiez l'URIemplacement de la sauvegarde à restaurer dans Amazon S3.
Backup version (Version de sauvegarde) Éventuellement, spécifiez le nom de version de la sauvegarde dans Backup Location (Emplacement de sauvegarde) à utiliser. Si vous laissez ce champ vide, Amazon EMR utilise la dernière sauvegarde de Backup Location pour remplir le nouveau HBase cluster.
Schedule Regular Backups (Planifier des sauvegardes régulières) Spécifiez s'il convient de planifier des sauvegardes incrémentielles automatiques. La première sauvegarde est une sauvegarde complète pour créer une référence pour les futures sauvegardes incrémentielles.
Consistent backup (Sauvegarde uniforme) Spécifiez si les sauvegardes doivent être cohérentes. Une sauvegarde cohérente est une sauvegarde qui interrompt les opérations d'écriture au cours de la phase initiale de sauvegarde, pour la synchronisation entre les nœuds. Les éventuelles opérations d'écriture ainsi interrompues sont placées dans une file d'attente et reprises lorsque la synchronisation est terminée.
Backup frequency (Fréquence de sauvegarde) Le nombre de sauvegardes planifiées days/hours/minutes entre deux.
Backup location (Emplacement de sauvegarde) L'Amazon S3 URI où les sauvegardes sont stockées. L'emplacement de sauvegarde de chaque HBase cluster doit être différent pour garantir que les sauvegardes différentielles restent correctes.
Backup start time (Heure de début de sauvegarde) Spécifiez quand la première sauvegarde doit avoir lieu. Vous pouvez définir ce paramètre surnow, ce qui entraîne le démarrage de la première sauvegarde dès que le cluster est en cours d'exécution, ou saisir une date et une heure au ISOformat. Par exemple, 2012-06-15T 20:00 Z fixerait l'heure de début au 15 juin 2012 à 20 heures. UTC

L'exemple de AWS CLI commande suivant lance un cluster avec HBase d'autres applications :

Note

Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

aws emr create-cluster --name "Test cluster" --ami-version 3.3 \ --applications Name=Hue Name=Hive Name=Pig Name=HBase \ --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type c1.xlarge --instance-count 3 --termination-protected

Une fois la connexion établie entre le Hive et les HBase clusters (comme indiqué dans la procédure précédente), vous pouvez accéder aux données stockées sur le HBase cluster en créant une table externe dans Hive.

L'exemple suivant, lorsqu'il est exécuté à partir de l'invite Hive, crée une table externe qui fait référence aux données stockées dans une HBase table appeléeinputTable. Vous pouvez ensuite faire référence inputTable dans les instructions Hive pour interroger et modifier les données stockées dans le HBase cluster.

Note

L'exemple suivant utilise protobuf-java-2.4.0a.jar dans la version AMI 2.3.3, mais vous devez le modifier pour qu'il corresponde à votre version. Pour vérifier la version des Protocol Buffers dont JAR vous disposez, exécutez la commande à l'invite de commande Hive :. ! ls /home/hadoop/lib;

add jar lib/emr-metrics-1.0.jar ; add jar lib/protobuf-java-2.4.0a.jar ; set hbase.zookeeper.quorum=ec2-107-21-163-157.compute-1.amazonaws.com ; create external table inputTable (key string, value string) stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdeproperties ("hbase.columns.mapping" = ":key,f1:col1") tblproperties ("hbase.table.name" = "t1"); select count(*) from inputTable ;

Personnalisation de la configuration HBase

Bien que les paramètres par défaut devraient fonctionner pour la plupart des applications, vous avez la possibilité de modifier vos paramètres HBase de configuration. Pour ce faire, exécutez l'un des deux scripts d'action d'amorçage :

  • configure-hbase-daemons—Configure les propriétés des démons master, regionserver et zookeeper. Ces propriétés incluent la taille du segment de mémoire et les options à transmettre à la machine virtuelle Java (JVM) au démarrage du HBase démon. Vous définissez ces propriétés en tant qu'arguments dans l'action d'amorçage. Cette action d'amorçage modifie le fichier de configuration/home/hadoop/conf/hbase-user-env.sh sur le HBase cluster.

  • configure-hbase —Configure les paramètres HBase spécifiques au site, tels que le port auquel le HBase maître doit se lier et le nombre maximal de fois que le client doit réessayer une action. CLI Vous pouvez les one-by-one définir en tant qu'arguments dans l'action bootstrap, ou vous pouvez spécifier l'emplacement d'un fichier de XML configuration dans Amazon S3. Cette action d'amorçage modifie le fichier de configuration the /home/hadoop/conf/hbase -site.xml sur le HBase cluster.

Note

Ces scripts, comme les autres actions d'amorçage, ne peuvent être exécutés que lorsque le cluster est créé ; vous ne pouvez pas les utiliser pour modifier la configuration d'un HBase cluster en cours d'exécution.

Lorsque vous exécutez les actions configure-hbase ou configure-hbase-daemonsbootstrap, les valeurs que vous spécifiez remplacent les valeurs par défaut. Toutes les valeurs que vous ne définissez pas explicitement reçoivent les valeurs par défaut.

La configuration HBase à l'aide de ces actions bootstrap est analogue à l'utilisation des actions bootstrap dans Amazon EMR pour configurer les paramètres Hadoop et les propriétés du démon Hadoop. La différence est qu'il HBase n'y a pas d'options de mémoire par processus. Au lieu de cela, les options de mémoire sont définies à l'aide de l'--daemon-optsargument, où daemon est remplacé par le nom du daemon à configurer.

Configurer les HBase démons

Amazon EMR fournit une action bootstraps3://region.elasticmapreduce/bootstrap-actions/configure-hbase-daemons, que vous pouvez utiliser pour modifier la configuration des HBase démons, où region est la région dans laquelle vous lancez votre HBase cluster.

Pour configurer HBase des démons à l'aide de AWS CLI, ajoutez l'action configure-hbase-daemons bootstrap lorsque vous lancez le cluster afin de configurer un ou plusieurs démons. HBase Vous pouvez définir les propriétés suivantes :

Propriété Description
hbase-master-opts Options qui contrôlent la façon dont le démon principal est JVM exécuté. Si cette option est définie, elles remplacent les OPTS variables HBASE _ MASTER _ par défaut.
regionserver-opts Options qui contrôlent le mode d'JVMexécution du démon du serveur régional. Si cette option est définie, elles remplacent les OPTS variables HBASE _ REGIONSERVER _ par défaut.
zookeeper-opts Options qui contrôlent la façon dont le JVM démon zookeeper est exécuté. Si cette option est définie, elles remplacent les OPTS variables HBASE _ ZOOKEEPER _ par défaut.

Pour plus d'informations sur ces options, consultez le fichier hbase-env.sh dans la HBase documentation.

Une action d'amorçage permettant de configurer les valeurs de zookeeper-opts et hbase-master-opts est illustrée dans l'exemple suivant.

Note

Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

aws emr create-cluster --name "Test cluster" --ami-version 3.3 \ --applications Name=Hue Name=Hive Name=Pig Name=HBase \ --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type c1.xlarge --instance-count 3 --termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-daemons,\ Args=["--hbase-zookeeper-opts=-Xmx1024m -XX:GCTimeRatio=19","--hbase-master-opts=-Xmx2048m","--hbase-regionserver-opts=-Xmx4096m"]

Configuration des paramètres HBase du site

Amazon EMR fournit une action bootstraps3://elasticmapreduce/bootstrap-actions/configure-hbase, que vous pouvez utiliser pour modifier la configuration deHBase. Vous pouvez définir des valeurs de configuration one-by-one, comme arguments dans l'action bootstrap, ou vous pouvez spécifier l'emplacement d'un fichier de XML configuration dans Amazon S3. La définition de valeurs de configuration one-by-one est utile si vous ne devez définir que quelques paramètres de configuration. Il est utile de les définir à l'aide d'un XML fichier si vous devez apporter de nombreuses modifications ou si vous souhaitez enregistrer vos paramètres de configuration pour les réutiliser.

Note

Vous pouvez préfixer le nom du compartiment Amazon S3 avec un préfixe de région, tel ques3://region.elasticmapreduce/bootstrap-actions/configure-hbase, où region est la région dans laquelle vous lancez votre HBase cluster.

Cette action d'amorçage modifie le fichier /home/hadoop/conf/hbase-site.xml de configuration du HBase cluster. L'action bootstrap ne peut être exécutée que lorsque le HBase cluster est lancé.

Pour plus d'informations sur les paramètres du HBase site que vous pouvez configurer, consultez la section Configuration par défaut dans la HBase documentation.

Définissez l'action configure-hbase bootstrap lorsque vous lancez le HBase cluster et spécifiez les valeurs hbase-site.xml à modifier.

Pour définir les paramètres individuels HBase du site à l'aide du AWS CLI
  • Pour modifier le hbase.hregion.max.filesize paramètre, tapez la commande suivante et remplacez myKey avec le nom de votre paire de EC2 clés Amazon.

    Note

    Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

    aws emr create-cluster --name "Test cluster" --ami-version 3.3 \ --applications Name=Hue Name=Hive Name=Pig Name=HBase \ --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type c1.xlarge --instance-count 3 --termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["-s","hbase.hregion.max.filesize=52428800"]
Pour définir les paramètres HBase du site avec un XML fichier à l'aide du AWS CLI
  1. Créez une version personnalisée de hbase-site.xml. Votre fichier personnalisé doit être valideXML. Pour réduire le risque d'introduction d'erreurs, commencez par la copie par défaut dehbase-site.xml, située sur le nœud EMR HBase principal Amazon à l'adresse/home/hadoop/conf/hbase-site.xml, et modifiez une copie de ce fichier au lieu de créer un fichier à partir de zéro. Vous pouvez donner un nouveau nom à votre nouveau fichier ou conserver le nom hbase-site.xml.

  2. Chargez votre fichier hbase-site.xml personnalisé sur un compartiment Amazon S3. Les autorisations doivent être définies pour que le AWS compte qui lance le cluster puisse accéder au fichier. Si le AWS compte qui lance le cluster possède également le compartiment Amazon S3, il y a accès.

  3. Définissez l'action de démarrage configure-hbase lorsque vous lancez le HBase cluster et incluez l'emplacement de votre fichier personnalisé. hbase-site.xml L'exemple suivant définit les valeurs de configuration du HBase site selon celles spécifiées dans le fichiers3://amzn-s3-demo-bucket/my-hbase-site.xml. Tapez la commande suivante, remplacez myKey avec le nom de votre paire de EC2 clés, et remplacez amzn-s3-demo-bucket avec le nom de votre compartiment Amazon S3.

    Note

    Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

    aws emr create-cluster --name "Test cluster" --ami-version 3.3 \ --applications Name=Hue Name=Hive Name=Pig Name=HBase \ --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type c1.xlarge --instance-count 3 --termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["--site-config-file","s3://amzn-s3-demo-bucket/config.xml"]

    Si vous spécifiez plusieurs options pour personnaliser le HBase fonctionnement, vous devez ajouter un commutateur d'-soptions à chaque paire clé-valeur, comme indiqué dans l'exemple suivant :

    --bootstrap-actions s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["-s","zookeeper.session.timeout=60000"]

Une fois le proxy défini et la SSH connexion ouverte, vous pouvez afficher l'HBaseinterface utilisateur en ouvrant une fenêtre de navigateur avec http ://master-public-dns-name:60010/master-status, où master-public-dns-name est l'DNSadresse publique du nœud maître du HBase cluster.

Vous pouvez consulter les HBase journaux actuels en utilisant SSH pour vous connecter au nœud principal et en accédant au mnt/var/log/hbase répertoire. Ces journaux ne sont pas disponibles une fois que le cluster a été arrêté sauf si vous activez la journalisation dans Amazon S3 lorsque le cluster est lancé.

Sauvegarder et restaurer HBase

Amazon EMR permet de sauvegarder vos HBase données sur Amazon S3, soit manuellement, soit selon un calendrier automatisé. Vous pouvez effectuer des sauvegardes complètes et incrémentielles. Une fois que vous disposez d'une version sauvegardée des HBase données, vous pouvez restaurer cette version dans un HBase cluster. Vous pouvez effectuer une restauration sur un HBase cluster en cours d'exécution ou lancer un nouveau cluster prérempli de données sauvegardées.

Pendant le processus de sauvegarde, HBase continue d'exécuter les commandes d'écriture. Cela garantit la disponibilité du cluster tout au long de la sauvegarde, mais cela entraîne un risque d'incohérence entre les données en cours de sauvegarde et les éventuelles opérations d'écriture en cours d'exécution en parallèle. Pour comprendre les incohérences qui peuvent survenir, vous devez tenir compte du fait que les opérations d'HBaseécriture sont réparties entre les nœuds de son cluster. Si une opération d'écriture se produit après qu'un nœud particulier a été interrogé, ces données ne sont pas incluses dans l'archive de sauvegarde. Vous pouvez même constater que les écritures antérieures sur le HBase cluster (envoyées à un nœud qui a déjà été interrogé) ne figurent peut-être pas dans l'archive de sauvegarde, alors que les écritures ultérieures (envoyées à un nœud avant qu'il ne soit interrogé) sont incluses.

Si une sauvegarde cohérente est requise, vous devez suspendre les écritures HBase pendant la partie initiale du processus de sauvegarde, c'est-à-dire la synchronisation entre les nœuds. Pour cela, vous pouvez spécifier le paramètre --consistent lorsque vous demandez une sauvegarde. Avec ce paramètre, les écritures intervenant au cours de cette période sont mises en file d'attente et exécutées dès que la synchronisation se termine. Vous pouvez également planifier des sauvegardes récurrentes, ce qui résout les incohérences au fil du temps, car les données qui manquent dans un cycle de sauvegarde sont sauvegardées lors du cycle suivant.

Lorsque vous sauvegardez HBase des données, vous devez spécifier un répertoire de sauvegarde différent pour chaque cluster. Un moyen simple pour cela consiste à utiliser l'identifiant du cluster dans le chemin d'accès spécifié pour le répertoire de sauvegarde. Par exemple, s3://amzn-s3-demo-bucket/backups/j-3AEXXXXXX16F2. Cela garantit que toutes les futures sauvegardes incrémentielles font référence au HBase cluster approprié.

Lorsque vous êtes prêt à supprimer les anciens fichiers de sauvegarde devenus inutiles, nous vous recommandons d'effectuer d'abord une sauvegarde complète de vos HBase données. Ceci garantit la conservation de toutes les données et fournit un point de départ pour les futures sauvegardes incrémentielles. Une fois la sauvegarde complète terminée, vous pouvez accédez à l'emplacement de sauvegarde et supprimer manuellement les anciens fichiers de sauvegarde.

Le processus HBase de sauvegarde utilise S3 DistCp pour l'opération de copie, qui comporte certaines limites concernant l'espace de stockage temporaire des fichiers.

Sauvegarde et restauration à HBase l'aide de la console

La console permet de lancer un nouveau cluster et de le remplir avec les données d'une HBase sauvegarde précédente. Il vous permet également de planifier des sauvegardes incrémentielles périodiques des HBase données. Des fonctionnalités de sauvegarde et de restauration supplémentaires, telles que la possibilité de restaurer des données sur un cluster déjà actif, d'effectuer des sauvegardes manuelles et de planifier des sauvegardes complètes automatisées, sont disponibles à l'aide duCLI.

Pour remplir un nouveau cluster avec des HBase données archivées à l'aide de la console
  1. Accédez à la nouvelle EMR console Amazon et sélectionnez Basculer vers l'ancienne console dans la navigation latérale. Pour plus d'informations sur ce qu'implique le passage à l'ancienne console, consultez la rubrique Utilisation de l'ancienne console.

  2. Choisissez Créer un cluster.

  3. Dans la section Configuration logicielle, pour Applications supplémentaires, sélectionnez Configurer HBaseet ajouter.

  4. Dans la boîte de dialogue Add Application (Ajouter une application), cochez Restore From Backup (Restituer à partir d'une sauvegarde).

  5. Pour Backup Location, spécifiez l'emplacement de la sauvegarde à charger dans le nouveau HBase cluster. Il doit s'agir d'un Amazon S3 URL du formulaires3://myawsbucket/backups/.

  6. Pour Backup Version (Version de sauvegarde), vous avez la possibilité de spécifier le nom d'une version de sauvegarde à charger en définissant une valeur. Si vous ne définissez pas de valeur pour la version de sauvegarde, Amazon EMR charge la dernière sauvegarde à l'emplacement indiqué.

  7. Choisissez Ajouter, puis créez le cluster avec d'autres options, si vous le souhaitez.

Pour planifier des sauvegardes automatisées des HBase données à l'aide de la console
  1. Dans la section Configuration logicielle, pour Applications supplémentaires, sélectionnez Configurer HBaseet ajouter.

  2. Choisissez Schedule Regular Backups (Planifier des sauvegardes régulières).

  3. Spécifiez si les sauvegardes doivent être cohérentes. Une sauvegarde cohérente est une sauvegarde qui interrompt les opérations d'écriture au cours de la phase initiale de sauvegarde, pour la synchronisation entre les nœuds. Les éventuelles opérations d'écriture ainsi interrompues sont placées dans une file d'attente et reprises lorsque la synchronisation est terminée.

  4. Définissez la fréquence à laquelle les sauvegardes doivent intervenir en entrant un nombre pour Backup Frequency (Fréquence de sauvegarde) et en choisissant Jours, Heures ou Minutes. La première sauvegarde automatique exécutée est une sauvegarde complète ; Amazon EMR enregistre ensuite les sauvegardes incrémentielles selon le calendrier que vous spécifiez.

  5. Spécifiez l'emplacement dans Amazon S3 où les sauvegardes doivent être stockées. Chaque HBase cluster doit être sauvegardé dans un emplacement distinct dans Amazon S3 afin de garantir que les sauvegardes incrémentielles sont correctement calculées.

  6. Spécifiez quand la première sauvegarde doit intervenir en définissant une valeur pour Backup Start Time (Heure de début de sauvegarde). Vous pouvez définir ce paramètre surnow, ce qui entraîne le démarrage de la première sauvegarde dès que le cluster est en cours d'exécution, ou saisir une date et une heure au ISOformat. Par exemple, 2013-09-26T 20:00 Z définit l'heure de début au 26 septembre 2013 à 20 heures. UTC

  7. Choisissez Ajouter.

  8. Procédez à la création du cluster avec d'autres options, si vous le souhaitez.

Moniteur HBase avec CloudWatch

Amazon EMR indique trois indicateurs CloudWatch que vous pouvez utiliser pour surveiller vos HBase sauvegardes. Ces mesures sont poussées CloudWatch à des intervalles de cinq minutes et sont fournies gratuitement.

Métrique Description
HBaseBackupFailed

Si la dernière sauvegarde a échoué. La valeur est définie sur 0 par défaut et mise à jour sur 1 en cas d'échec de la tentative de sauvegarde précédente. Cette métrique n'est signalée que pour les HBase clusters.

Cas d'utilisation : surveiller les HBase sauvegardes

Unités : nombre

HBaseMostRecentBackupDuration

Délai nécessaire à l'exécution de la précédente sauvegarde. Cette métrique est définie même si la dernière sauvegarde a réussi ou a échoué. Lorsque la sauvegarde est en cours, cette métrique retourne le nombre de minutes qui se sont écoulées depuis le démarrage de la sauvegarde. Cette métrique n'est signalée que pour les HBase clusters.

Cas d'utilisation : Surveiller les HBase sauvegardes

Unités : minutes

HBaseTimeSinceLastSuccessfulBackup

Nombre de minutes écoulées après le démarrage de la dernière HBase sauvegarde réussie sur votre cluster. Cette métrique n'est signalée que pour les HBase clusters.

Cas d'utilisation : surveiller les HBase sauvegardes

Unités : minutes

Configurer Ganglia pour HBase

Vous configurez Ganglia pour HBase utiliser l'action configure-hbase-for-gangliabootstrap. Cette action de bootstrap est configurée HBase pour publier des métriques sur Ganglia.

Vous devez configurer HBase et Ganglia lorsque vous lancez le cluster ; les rapports Ganglia ne peuvent pas être ajoutés à un cluster en cours d'exécution.

Ganglia stocke également les fichiers journaux sur le serveur à l'adresse /mnt/var/log/ganglia/rrds. Si vous avez configuré votre cluster pour conserver les fichiers journaux dans un compartiment Amazon S3, les fichiers journaux Ganglia y sont conservés également.

Pour lancer un cluster avec Ganglia forHBase, utilisez l'action configure-hbase-for-gangliabootstrap comme indiqué dans l'exemple suivant.

Note

Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

aws emr create-cluster --name "Test cluster" --ami-version 3.3 \ --applications Name=Hue Name=Hive Name=Pig Name=HBase Name=Ganglia \ --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type c1.xlarge --instance-count 3 --termination-protected \ --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-for-ganglia

Une fois que le cluster a été lancé et Ganglia configuré, vous pouvez accéder aux graphiques et rapports Ganglia à l'aide de l'interface graphique en cours d'exécution sur le nœud maître.