Versiones de HBase compatibles Requisitos previos de clúster de HBase Creación de un clúster con HBase Personalización de la configuración de HBase Hacer una copia de seguridad y restaurar HBase Supervise HBase con CloudWatch Configuración de Ganglia para HBase

Detalles específicos de las aplicaciones HBase para versiones anteriores de la AMI de Amazon EMR

Versiones de HBase compatibles

Versión de HBase Versión de AMI AWS CLI parámetros de configuración Detalles de la versión de HBase

Versión de HBase	Versión de AMI	AWS CLI parámetros de configuración	Detalles de la versión de HBase
0.94.18	3.1.0 y versiones posteriores	`--ami-version 3.1` `--ami-version 3.2` `--ami-version 3.3` `--applications Name=HBase`	Correcciones de errores y mejoras.
0.94.7	3.0-3.0.4	`--ami-version 3.0` `--applications Name=HBase`
0.92	2.2 y versiones posteriores	`--ami-version 2.2 or later` `--applications Name=HBase`

0.94.18

3.1.0 y versiones posteriores

--ami-version 3.1

--ami-version 3.2

--ami-version 3.3

--applications Name=HBase

Correcciones de errores y mejoras.

0.94.7

3.0-3.0.4

--ami-version 3.0

--applications Name=HBase

0.92

2.2 y versiones posteriores

--ami-version 2.2 or later

--applications Name=HBase

Requisitos previos de clúster de HBase

Un clúster creado con las versiones 2.x y 3.x de la AMI de Amazon EMR debe cumplir los requisitos siguientes para HBase.

El AWS CLI (opcional): para interactuar con HBase mediante la línea de comandos, descargue e instale la última versión de. AWS CLI Para obtener más información, consulte Installing the AWS Command Line Interface en la Guía del usuario de AWS Command Line Interface .
Al menos dos instancias (opcional): el nodo maestro del clúster ejecuta el servidor maestro de HBase y ZooKeeper, y los nodos de tareas ejecutan los servidores de la región de HBase. Para obtener el máximo rendimiento, los clústeres de HBase deben ejecutarse en al menos dos instancias EC2, pero puede ejecutar HBase en un único nodo para fines de evaluación.
Clúster de ejecución prolongada: HBase solo se ejecuta en clústeres de ejecución prolongada. La CLI y la consola de Amazon EMR crean clústeres de ejecución prolongada de manera predeterminada.
Un conjunto de par de claves de Amazon EC2 (recomendado): para utilizar el protocolo de red Secure Shell (SSH) para conectar con el nodo maestro y ejecutar comandos de intérprete de comandos de HBase, debe utilizar un par de claves de Amazon EC2 al crear el clúster.
Las versiones correctas de AMI y Hadoop: los clústeres de HBase en la actualidad se admiten únicamente en Hadoop 20.205 o versiones posteriores.
Ganglia (opcional): para monitorizar las métricas de desempeño de HBase, instale Ganglia al crear el clúster.
Un bucket de Amazon S3 para registros (opcional): los registros para HBase están disponibles en el nodo maestro. Si desea que estos registros se copien en Amazon S3, especifique un bucket de S3 para que reciba archivos de registro al crear el clúster.

Creación de un clúster con HBase

En la siguiente tabla se muestran las opciones disponibles cuando se utiliza la consola para crear un clúster con HBase mediante una versión de AMI de Amazon EMR.

Campo	Acción
Restore from backup (Restaurar desde copia de seguridad)	Especifique si desea precargar el clúster de HBase con datos almacenados en Amazon S3.
Backup location (Ubicación de copia de seguridad)	Especifique el URI donde reside en Amazon S3 la copia de seguridad desde la que realizará la restauración.
Backup version (Versión de copia de seguridad)	Opcionalmente, especifique el nombre de la versión de la copia de seguridad en Backup Location (Ubicación de copia de seguridad) que desea utilizar. Si deja este campo en blanco, Amazon EMR utilizará la última copia de seguridad en Ubicación de copia de seguridad para rellenar el nuevo clúster de HBase.
Schedule Regular Backups (Programar copia de seguridads periódicas)	Especifique si desea programar copias de seguridad incrementales automáticas. La primera copia de seguridad es una copia de seguridad completa para crear una referencia para futuros copias de seguridad incrementales.
Consistent backup (Copia de seguridad consistente)	Especifique si las copias de seguridad deben ser consistentes. Una copia de seguridad coherente es la que pone en pausa las operaciones de escritura durante la etapa de copia de seguridad inicial, con sincronización entre nodos. Cualquier operación de escritura que se haya puesto en pausa de este modo se coloca en una cola y se reanuda cuando se completa la sincronización.
Backup frequency (Frecuencia de copia de seguridad)	El número de días/horas/minutos entre copias de seguridad programadas.
Backup location (Ubicación de copia de seguridad)	El URI de Amazon S3 donde se almacenan las copias de seguridad. La ubicación de copia de seguridad de cada clúster de HBase debe ser diferente para garantizar que las copias de seguridad diferenciales se mantengan correctas.
Backup start time (Hora de inicio de copia de seguridad)	Especifica cuándo debe realizarse la primera copia de seguridad. Puede definirlo en `now`, lo que hace que la primera copia de seguridad comience en cuanto el clúster se ejecute, o escriba una fecha y hora con formato ISO. Por ejemplo, 2012-06-15T20:00 Z establecería la hora de inicio en el 15 de junio de 2012 a las 8:00 p. m. UTC.

El siguiente AWS CLI comando de ejemplo lanza un clúster con HBase y otras aplicaciones:

nota

Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).


aws emr create-cluster --name "Test cluster" --ami-version 3.3 \
               --applications Name=Hue Name=Hive Name=Pig Name=HBase \
               --use-default-roles --ec2-attributes KeyName=myKey \
               --instance-type c1.xlarge --instance-count 3 --termination-protected

Después de haber realizado la conexión entre los clústeres de Hive y HBase (tal y como se muestra en el procedimiento anterior), puede acceder a los datos almacenados en el clúster de HBase creando una tabla externa en Hive.

En el siguiente ejemplo, cuando se ejecuta desde el símbolo del sistema de Hive, se crea una tabla externa que hace referencia a los datos almacenados en una tabla de HBase denominada inputTable. A continuación, puede hacer referencia a inputTable en instrucciones de Hive para consultar y modificar los datos almacenados en el clúster de HBase.

nota

El siguiente ejemplo utiliza protobuf-java-2.4.0a.jar en la AMI 2.3.3, pero debe modificar el ejemplo de adaptarlo a su versión. Para comprobar la versión de Protocol Buffers JAR que tiene, ejecute el comando en el símbolo del sistema de Hive: ! ls /home/hadoop/lib;.


add jar lib/emr-metrics-1.0.jar ;
               add jar lib/protobuf-java-2.4.0a.jar ;
               
               set hbase.zookeeper.quorum=ec2-107-21-163-157.compute-1.amazonaws.com ;
               
               create external table inputTable (key string, value string)
                    stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
                     with serdeproperties ("hbase.columns.mapping" = ":key,f1:col1")
                     tblproperties ("hbase.table.name" = "t1");
               
               select count(*) from inputTable ;

Personalización de la configuración de HBase

Aunque la configuración predeterminada debería funcionar con la mayoría de aplicaciones, tiene flexibilidad para modificar sus opciones de configuración de HBase. Para ello, ejecute uno de los dos scripts de acciones de arranque:

configure-hbase-daemons—Configura las propiedades de los daemons master, regionserver y zookeeper. Estas propiedades incluyen el tamaño de montón y opciones que transferir a la Máquina virtual Java (JVM) cuando se inicia el daemon de HBase. Puede definir estas propiedades como argumentos en la acción de arranque. Esta acción de arranque modifica el archivo de configuración /home/hadoop/conf/ .sh en el clúster de HBase. hbase-user-env
configure-hbase: configura opciones específicas del sitio de HBase tales como el puerto al que debe vincular el maestro HBase y el número máximo de veces que el cliente de la CLI debe volver a intentar una acción. Puede configurarlos one-by-one como argumentos en la acción de arranque o puede especificar la ubicación de un archivo de configuración XML en Amazon S3. Esta acción de arranque modifica el archivo de configuración /home/hadoop/conf/hbase-site.xml en el clúster de HBase.

nota

Estos scripts, al igual que otras acciones de arranque, solo se pueden ejecutar cuando se crea el clúster; no puede utilizarlos para cambiar la configuración de un clúster de HBase que se está ejecutando en este momento.

Al ejecutar las acciones configure-hbase o configure-hbase-daemonsbootstrap, los valores que especifique anulan los valores predeterminados. Cualquier valor que no haya definido explícitamente toma los valores predeterminados.

La configuración de HBase con estas acciones de arranque es análoga al uso de acciones de arranque en Amazon EMR para configurar opciones de Hadoop y propiedades de daemon de Hadoop. La diferencia es que HBase no dispone de opciones de memoria por proceso. En su lugar, las opciones de memoria se establecen utilizando el argumento --daemon-opts, donde daemon se sustituye por el nombre del daemon que se desea configurar.

Configurar daemons de HBase

Amazon EMR proporciona una acción de arranque, s3://region.elasticmapreduce/bootstrap-actions/configure-hbase-daemons, que puede utilizar para cambiar la configuración de daemons de HBase, donde región es la región en la que desea lanzar el clúster de HBase.

Para configurar los daemons de HBase mediante la AWS CLI, añada la acción de configure-hbase-daemons arranque al lanzar el clúster para configurar uno o más daemons de HBase. Puede definir las siguientes propiedades:

Propiedad	Descripción
`hbase-master-opts`	Opciones que controlan cómo la JVM ejecuta el daemon maestro. Si están definidas, anulan las variables HBASE_MASTER_OPTS predeterminadas.
`regionserver-opts`	Opciones que controlan cómo la JVM ejecuta el daemon de servidor de región. Si están definidas, anulan las variables HBASE_REGIONSERVER_OPTS predeterminadas.
`zookeeper-opts`	Opciones que controlan cómo la JVM ejecuta el daemon zookeeper. Si están definidas, anulan las variables HBASE_ZOOKEEPER_OPTS predeterminadas.

Para obtener más información sobre estas opciones, consulte hbase-env.sh en la documentación de HBase.

En el siguiente ejemplo se muestra una acción de arranque para configurar valores para zookeeper-opts y hbase-master-opts.

nota


aws emr create-cluster --name "Test cluster" --ami-version 3.3 \
--applications Name=Hue Name=Hive Name=Pig Name=HBase \
--use-default-roles --ec2-attributes KeyName=myKey \
--instance-type c1.xlarge --instance-count 3 --termination-protected \
--bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-daemons,\
Args=["--hbase-zookeeper-opts=-Xmx1024m -XX:GCTimeRatio=19","--hbase-master-opts=-Xmx2048m","--hbase-regionserver-opts=-Xmx4096m"]

Configurar ajustes de sitio de HBase

Amazon EMR proporciona una acción de arranque, s3://elasticmapreduce/bootstrap-actions/configure-hbase, que puede utilizar para cambiar la configuración de HBase. Puede establecer valores de configuración one-by-one, como argumentos en la acción de arranque, o puede especificar la ubicación de un archivo de configuración XML en Amazon S3. Establecer los valores de configuración one-by-one es útil si solo necesita establecer algunos ajustes de configuración. Definirlos utilizando un archivo XML resulta útil si tiene que hacer muchos cambios o si desea guardar las opciones de configuración que reutilizar.

nota

Puede agregar un prefijo de región al nombre del bucket de Amazon S3, como s3://region.elasticmapreduce/bootstrap-actions/configure-hbase, donde region es la región donde se va a lanzar el clúster de HBase.

Esta acción de arranque modifica el archivo de configuración /home/hadoop/conf/hbase-site.xml en el clúster de HBase. La acción de arranque solo se puede ejecutar cuando se ha lanzado el clúster de HBase.

Para más información sobre los ajustes del sitio de HBase que se pueden configurar, consulte Configuración predeterminada en la documentación de HBase.

Defina la acción de arranque configure-hbase al lanzar el clúster de HBase y especifique los valores en hbase-site.xml que desea cambiar.

Para especificar la configuración individual de un sitio de HBase mediante el AWS CLI

Para cambiar el ajuste hbase.hregion.max.filesize, escriba el comando siguiente y sustituya myKey por el nombre de su par de claves de Amazon EC2.

nota


aws emr create-cluster --name "Test cluster" --ami-version 3.3 \
--applications Name=Hue Name=Hive Name=Pig Name=HBase \
--use-default-roles --ec2-attributes KeyName=myKey \
--instance-type c1.xlarge --instance-count 3 --termination-protected \
--bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["-s","hbase.hregion.max.filesize=52428800"]

Para especificar la configuración del sitio de HBase con un archivo XML mediante el AWS CLI

Cree una versión personalizada de hbase-site.xml. Su archivo personalizado debe ser XML válido. Para reducir la probabilidad de introducir errores, empiece por la copia predeterminada de hbase-site.xml, que se encuentra en el nodo maestro de HBase de Amazon EMR en /home/hadoop/conf/hbase-site.xml y edite una copia de dicho archivo en lugar de crearlo desde cero. Puede proporcionar un nombre nuevo al nuevo archivo o dejarlo como hbase-site.xml.
Cargue el archivo hbase-site.xml personalizado en un bucket de Amazon S3. Debe tener los permisos establecidos para que la AWS cuenta que lanza el clúster pueda acceder al archivo. Si la AWS cuenta que lanza el clúster también es propietaria del bucket de Amazon S3, tendrá acceso.
Defina la acción de arranque configure-hbase cuando lance el clúster de HBase e incluya la ubicación del archivo hbase-site.xml personalizado. El ejemplo siguiente establece los valores de configuración de sitio de HBase en los especificados en el archivo s3://mybucket/my-hbase-site.xml. Escriba el comando siguiente, sustituya myKey por el nombre de su par de claves de EC2 y sustituya mybucket por el nombre de su bucket de Amazon S3.

nota
Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).
```
aws emr create-cluster --name "Test cluster" --ami-version 3.3 \
        --applications Name=Hue Name=Hive Name=Pig Name=HBase \
        --use-default-roles --ec2-attributes KeyName=myKey \
        --instance-type c1.xlarge --instance-count 3 --termination-protected \
        --bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["--site-config-file","s3://mybucket/config.xml"]
```
Si especifica más de una opción para personalizar la operación de HBase, debe adjuntar cada par de clave-valor a un modificador de la opción -s, tal y como se muestra en el ejemplo siguiente:
```
       --bootstrap-actions s3://elasticmapreduce/bootstrap-actions/configure-hbase,Args=["-s","zookeeper.session.timeout=60000"]
       				
```

Con el proxy configurado y la conexión SSH abiertos, puede ver la interfaz de usuario de HBase abriendo una ventana del navegador con http: //:60010/master-status master-public-dns-name, donde se encuentra master-public-dns-namela dirección DNS pública del nodo principal del clúster de HBase.

Puede consultar los registros de HBase actuales utilizando SSH para conectar al nodo principal y acceder al directorio mnt/var/log/hbase. Estos registros no estarán disponibles una vez que el clúster se haya terminado a menos que hubiera habilitado el registro en Amazon S3 cuando se lanzó el clúster.

Hacer una copia de seguridad y restaurar HBase

Amazon EMR le brinda la posibilidad de hacer copias de seguridad de los datos de HBase en Amazon S3, ya sea manualmente o mediante una programación automatizada. Puede realizar tanto copias de seguridad completas como incrementales. Después de tener una versión en copia de seguridad de los datos de HBase, puede restaurar dicha versión a un clúster de HBase. Puede restaurar a un clúster de HBase que se está ejecutando actualmente o lanzar un nuevo clúster rellenando automáticamente con datos de copia de seguridad.

Durante el proceso de copia de seguridad, HBase sigue ejecutando comandos de escritura. Aunque esto garantiza que el clúster permanezca disponible durante la copia de seguridad, existe el riesgo de inconsistencia entre los datos cuya copia de seguridad se realiza y las operaciones de escritura que se ejecutan en paralelo. Para comprender las inconsistencias que podrían surgir, tiene que tener en cuenta que HBase distribuye las operaciones de escritura entre los nodos en su clúster. Si una operación de escritura se produce después de sondear un nodo determinado, dichos datos no se incluyen en el archivo de copia de seguridad. Puede incluso encontrar que las escrituras anteriores al clúster de HBase (enviado a un nodo que ya se ha sondeado) podrían no estar en el archivo de copia de seguridad, mientras que se incluyen las escrituras posteriores (enviadas a un nodo antes de sondearlo).

Si se requiere una copia de seguridad consistente, debe poner en pausa las escrituras en HBase durante la parte inicial del proceso de copia de seguridad, la sincronización entre nodos. Puede hacerlo especificando el parámetro --consistent al solicitar una copia de seguridad. Con este parámetro, las escrituras durante este período se ponen en cola y se ejecutan en cuanto se completa la sincronización. También puede programar copias de seguridad recurrentes, que resuelven cualquier inconsistencia a lo largo del tiempo, ya que los datos que faltan en un paso de copia de seguridad se incluyen en el siguiente paso de copia de seguridad.

Cuando haga una copia de seguridad de los datos de HBase, debería especificar un directorio de copia de seguridad distinto para cada clúster. Una forma sencilla de hacerlo consiste en utilizar el identificador del clúster como parte de la ruta especificada en el directorio de copia de seguridad. Por ejemplo, s3://mybucket/backups/j-3AEXXXXXX16F2. Esto garantiza que cualquier copia de seguridad incremental futura haga referencia al clúster de HBase correcto.

Cuando esté listo para eliminar los archivos de copia de seguridad antiguos que ya no son necesarios, le recomendamos que primero realice una copia de seguridad completa de sus datos de HBase. Esto garantiza que se conserven todos los datos y ofrece una línea de base para futuras copias de seguridad incrementales. Una vez realizado la copia de seguridad completa, puede acceder a la ubicación de copia de seguridad y eliminar manualmente los archivos de copia de seguridad antiguos.

El proceso de copia de seguridad de HBase utiliza S3 DistCp para la operación de copia, lo que presenta ciertas limitaciones en cuanto al espacio de almacenamiento temporal de archivos.

Hacer una copia de seguridad y restaurar HBase utilizando la consola

La consola ofrece la posibilidad de lanzar un nuevo clúster y rellenarlo con datos desde una copia de seguridad de HBase anterior. También le ofrece la posibilidad de programar copias de seguridad incrementales de datos de HBase. Otra funcionalidad adicional de copia de seguridad y restauración, como la posibilidad de restaurar datos en un clúster que ya está en ejecución, realizar copias de seguridad manuales y programar copias de seguridad completos automatizadas, está disponible utilizando la CLI.

Para rellenar un nuevo clúster con datos de HBase archivados utilizando la consola

Vaya hasta la nueva consola de Amazon EMR y seleccione Ir a la consola antigua en el panel de navegación lateral. Para más información sobre lo que puede esperar al cambiar a la consola antigua, consulte Uso de la consola antigua.
Elija Create cluster.
En la sección Software Configuration (Configuración de software), en Additional Applications (Aplicaciones adicionales), elija HBase y Configure and add (Configurar y añadir).
En el cuadro de diálogo Add Application (Añadir aplicación), marque Restore From Backup (Restaurar a partir de una copia de seguridad).
En Backup Location (Ubicación de copia de seguridad), especifique la ubicación del backup que desea cargar en el nuevo clúster de HBase. Debe ser una URL de Amazon S3 de la forma s3://myawsbucket/backups/.
Puede definir un valor para Backup Version (Versión de copia de seguridad) para especificar el nombre de la versión de copia de seguridad que desea cargar. Si no define un valor para la Versión de copia de seguridad, Amazon EMR carga la copia de seguridad más reciente en la ubicación especificada.
Elija Add (Añadir) y continúe con la creación del clúster especificando las demás opciones que desee.

Para programar copias de seguridad automatizadas de datos de HBase utilizando la consola

En la sección Software Configuration (Configuración de software), en Additional Applications (Aplicaciones adicionales), elija HBase y Configure and add (Configurar y añadir).
Elija Schedule Regular Backups (Programar copias de seguridad periódicas).
Especifique si las copias de seguridad deben ser consistentes. Una copia de seguridad coherente es la que pone en pausa las operaciones de escritura durante la etapa de copia de seguridad inicial, con sincronización entre nodos. Cualquier operación de escritura que se haya puesto en pausa de este modo se coloca en una cola y se reanuda cuando se completa la sincronización.
Defina la frecuencia con la que se deben realizar las copias de seguridad introduciendo un número para Backup Frequency (Frecuencia de copia de seguridad) y eligiendo Days (Días), Hours (Horas) o Minutes (Minutos). La primera copia de seguridad automatizada que se ejecuta es una copia de seguridad completa; posteriormente, Amazon EMR guarda las copias de seguridad incrementales en función de la programación que especifique.
Especifique la ubicación en Amazon S3 donde deben almacenarse las copias de seguridad. Se debe realizar una copia de seguridad de cada clúster de HBase en una ubicación independiente en Amazon S3 para garantizar que las copias de seguridad incrementales se calculen correctamente.
Especifique cuándo se debe realizar la primera copia de seguridad definiendo un valor para Backup Start Time (Hora de inicio de copia de seguridad). Puede definirlo en now, lo que hace que la primera copia de seguridad comience en cuanto el clúster se ejecute, o escriba una fecha y hora con formato ISO. Por ejemplo, 2013-09-26T20:00 Z establece la hora de inicio en el 26 de septiembre de 2013 a las 8:00 p. m. UTC.
Elija Añadir.
Continúe con la creación del clúster con otras opciones como desee.

Supervise HBase con CloudWatch

Amazon EMR informa de tres métricas CloudWatch que puede utilizar para supervisar sus copias de seguridad de HBase. Estas métricas se actualizan CloudWatch en intervalos de cinco minutos y se proporcionan de forma gratuita.

Métrica Descripción

Métrica	Descripción
`HBaseBackupFailed`	Si la última copia de seguridad produjo un error. Está establecido en 0 de forma predeterminada y se actualiza a 1 si el intento de copia de seguridad anterior produjo un error. Esta métrica solo se registra para los clústeres de HBase. Caso de uso: Monitorizar copias de seguridad de HBase Unidades: recuento
`HBaseMostRecentBackupDuration`	La cantidad de tiempo que tarda en completarse la copia de seguridad anterior. Esta métrica se establece independientemente de si la última copia de seguridad se realizó correctamente o produjo un error. Mientras la copia de seguridad está en curso, esta métrica devuelve el número de minutos tras el inicio de la copia de seguridad. Esta métrica solo se registra para los clústeres de HBase. Caso de uso: Monitorizar copias de seguridad de HBase Unidades: minutos
`HBaseTimeSinceLastSuccessfulBackup`	El número de minutos que han transcurrido desde que la última copia de seguridad de HBase correcta se inició en el clúster. Esta métrica solo se registra para los clústeres de HBase. Caso de uso: Monitorizar copias de seguridad de HBase Unidades: minutos

HBaseBackupFailed

Si la última copia de seguridad produjo un error. Está establecido en 0 de forma predeterminada y se actualiza a 1 si el intento de copia de seguridad anterior produjo un error. Esta métrica solo se registra para los clústeres de HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: recuento

HBaseMostRecentBackupDuration

La cantidad de tiempo que tarda en completarse la copia de seguridad anterior. Esta métrica se establece independientemente de si la última copia de seguridad se realizó correctamente o produjo un error. Mientras la copia de seguridad está en curso, esta métrica devuelve el número de minutos tras el inicio de la copia de seguridad. Esta métrica solo se registra para los clústeres de HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: minutos

HBaseTimeSinceLastSuccessfulBackup

El número de minutos que han transcurrido desde que la última copia de seguridad de HBase correcta se inició en el clúster. Esta métrica solo se registra para los clústeres de HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: minutos

Configuración de Ganglia para HBase

Para configurar Ganglia para HBase, utilice la configure-hbase-for-gangliaacción bootstrap. Esta acción de arranque configura HBase para publicar métricas en Ganglia.

Debe configurar HBase y Ganglia al lanzar el clúster; los informes de Ganglia no se pueden añadir a un clúster en ejecución.

Ganglia también almacena los archivos de registro en el servidor en /mnt/var/log/ganglia/rrds. Si configura su clúster para mantener los archivos de registro en un bucket de Amazon S3, los archivos de registro de Ganglia también se mantienen ahí.

Para lanzar un clúster con Ganglia for HBase, utilice la acción configure-hbase-for-gangliabootstrap como se muestra en el siguiente ejemplo.

nota


aws emr create-cluster --name "Test cluster" --ami-version 3.3 \
--applications Name=Hue Name=Hive Name=Pig Name=HBase Name=Ganglia \
--use-default-roles --ec2-attributes KeyName=myKey \
--instance-type c1.xlarge --instance-count 3 --termination-protected \
--bootstrap-actions Path=s3://elasticmapreduce/bootstrap-actions/configure-hbase-for-ganglia

Una vez que el clúster se haya lanzado con Ganglia configurado, puede acceder a los informes y gráficos de Ganglia utilizando la interfaz gráfica que se ejecuta en el nodo principal.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Hive

Pig