Apache HBase - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Apache HBase

HBaseé um banco de dados distribuído, não relacional e de código aberto desenvolvido como parte do projeto Hadoop da Apache Software Foundation. HBaseé executado sobre o Hadoop Distributed File System (HDFS) para fornecer recursos de banco de dados não relacional para o ecossistema Hadoop. HBaseestá incluído na EMR versão 4.6.0 e posterior da Amazon.

HBasefunciona perfeitamente com o Hadoop, compartilhando seu sistema de arquivos e servindo como entrada e saída diretas para a MapReduce estrutura e o mecanismo de execução. HBasetambém se integra ao Apache Hive, permitindo consultas SQL semelhantes a HBase tabelas, uniões com tabelas baseadas em Hive e suporte para conectividade de banco de dados Java (). JDBC Para obter mais informações sobreHBase, consulte o Apache HBase e a HBasedocumentação no site do Apache. Para ver um exemplo de como usar HBase com o Hive, consulte a postagem do blog de AWS Big Data Combine No SQL e análises massivamente paralelas usando o Apache HBase e o Apache Hive na Amazon. EMR

Com o HBase on AmazonEMR, você também pode fazer backup de seus HBase dados diretamente no Amazon Simple Storage Service (Amazon S3) e restaurar a partir de um backup criado anteriormente ao iniciar um cluster. HBase A Amazon EMR oferece opções adicionais de integração com o Amazon S3 para persistência de dados e recuperação de desastres.

  • HBaseno Amazon S3 - Com a EMR versão 5.2.0 e posterior da Amazon, você pode usar no Amazon HBase S3 para armazenar o diretório HBase raiz e os metadados de um cluster diretamente no Amazon S3. Posteriormente, você pode iniciar um novo cluster, apontando-o para o local do diretório de raiz no Amazon S3. Somente um cluster por vez pode usar a HBase localização no Amazon S3, com exceção de um cluster de réplica de leitura. Para obter mais informações, consulte HBaseno Amazon S3 (modo de armazenamento Amazon S3).

  • HBaseréplicas de leitura - A Amazon EMR versão 5.7.0 e posterior com o Amazon HBase S3 oferece suporte a clusters de réplicas de leitura. Um cluster de réplica de leitura fornece acesso somente leitura aos arquivos de armazenamento de um cluster primário e a metadados para operações somente leitura. Para obter mais informações, consulte Usar um cluster de réplica de leitura.

  • HBaseSnapshots - Como alternativa ao HBase Amazon S3, EMR com a versão 4.0 e posterior, você pode criar instantâneos de HBase seus dados diretamente no Amazon S3 e depois recuperar dados usando os snapshots. Para obter mais informações, consulte Usando HBase instantâneos.

Importante

Para a escalabilidade de EMR HBase clusters da Amazon, não recomendamos usar escalabilidade gerenciada ou escalabilidade com políticas personalizadas com clusters. HBase

A tabela a seguir lista a versão HBase incluída na versão mais recente da série Amazon EMR 7.x, junto com os componentes com os quais a Amazon é EMR instalada. HBase

Para a versão dos componentes instalados HBase nesta versão, consulte Versões de componentes da versão 7.2.0.

HBaseinformações sobre a versão do emr-7.2.0
Gravadora EMR de lançamento da Amazon HBaseVersão Componentes instalados com o HBase

emr-7.2.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

A tabela a seguir lista a versão HBase incluída na versão mais recente da série EMR 6.x da Amazon, junto com os componentes com os quais a Amazon é EMR instalada. HBase

Para a versão dos componentes instalados HBase nesta versão, consulte Versões de componentes da versão 6.15.0.

HBaseinformações da versão do emr-6.15.0
Gravadora EMR de lançamento da Amazon HBaseVersão Componentes instalados com o HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

nota

O Apache HBase HBCK2 é uma ferramenta operacional separada para reparar HBase regiões e tabelas do sistema. Na Amazon EMR versão 6.1.0 e posterior, o hbase-hbck2.jar é fornecido /usr/lib/hbase-operator-tools/ no nó primário. Para obter mais informações sobre como criar e usar a ferramenta, consulte HBaseHBCK2.

A tabela a seguir lista a versão HBase incluída na versão mais recente da série Amazon EMR 5.x, junto com os componentes com os quais a Amazon é EMR instalada. HBase

Para a versão dos componentes instalados HBase nesta versão, consulte Versões de componentes da versão 5.36.2.

HBaseinformações da versão do emr-5.36.2
Gravadora EMR de lançamento da Amazon HBaseVersão Componentes instalados com o HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server