Apache HBase - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache HBase

HBaseè un database distribuito open source, non relazionale, sviluppato nell'ambito del progetto Hadoop della Apache Software Foundation. HBaseviene eseguito su Hadoop Distributed File System (HDFS) per fornire funzionalità di database non relazionali per l'ecosistema Hadoop. HBaseè incluso nella EMR versione 4.6.0 e successive di Amazon.

HBasefunziona perfettamente con Hadoop, condividendone il file system e fungendo da input e output diretti per il framework e il MapReduce motore di esecuzione. HBasesi integra inoltre con Apache Hive, abilitando query SQL simili a quelle sulle tabelle, si unisce a HBase tabelle basate su Hive e supporta Java Database Connectivity (). JDBC Per ulteriori informazioni su, consulta Apache e la documentazione sul sito HBase Web di Apache. HBase HBase Per un esempio di utilizzo HBase con Hive, consulta il post sul blog AWS Big Data Combine No SQL and massively parallel analytics using Apache HBase e Apache Hive su Amazon. EMR

Con HBase on AmazonEMR, puoi anche eseguire il backup HBase dei dati direttamente su Amazon Simple Storage Service (Amazon S3) e ripristinarli da un backup creato in precedenza all'avvio di un cluster. HBase Amazon EMR offre opzioni aggiuntive per l'integrazione con Amazon S3 per la persistenza dei dati e il disaster recovery.

  • HBasesu Amazon S3 - Con Amazon EMR versione 5.2.0 e successive, puoi utilizzarlo su Amazon HBase S3 per archiviare la directory HBase principale e i metadati di un cluster direttamente su Amazon S3. In seguito puoi avviare un nuovo cluster, indirizzandolo alla posizione della directory principale in Amazon S3. Solo un cluster alla volta può utilizzare la HBase posizione in Amazon S3, ad eccezione di un cluster di lettura e replica. Per ulteriori informazioni, consulta HBasesu Amazon S3 (modalità di storage Amazon S3).

  • HBaseread-replicas - Amazon EMR versione 5.7.0 e successive con Amazon HBase S3 supporta i cluster di lettura-replica. Una replica di lettura al cluster fornisce accesso in sola lettura ai file e ai metadati dello store di un cluster principale per operazioni di sola lettura. Per ulteriori informazioni, consulta Utilizzo della replica di lettura al cluster.

  • HBaseIstantanee: in alternativa a HBase Amazon S3, EMR con la versione 4.0 e successive puoi creare istantanee dei HBase tuoi dati direttamente su Amazon S3 e quindi recuperare i dati utilizzando le istantanee. Per ulteriori informazioni, consulta Utilizzo delle istantanee HBase.

Importante

Per la scalabilità dei EMR HBase cluster Amazon, non è consigliabile utilizzare la scalabilità gestita o la scalabilità con politiche personalizzate con cluster. HBase

La tabella seguente elenca la versione HBase inclusa nell'ultima versione della serie Amazon EMR 7.x, insieme ai componenti con cui Amazon si EMR installa. HBase

Per la versione dei componenti installati con HBase questa versione, consulta Versioni dei componenti della release 7.3.0.

HBaseinformazioni sulla versione per emr-7.3.0
Etichetta EMR di rilascio Amazon HBaseVersione Componenti installati con HBase

emr-7.3.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

La tabella seguente elenca la versione HBase inclusa nell'ultima versione della serie Amazon EMR 6.x, insieme ai componenti con cui Amazon si EMR installa. HBase

Per la versione dei componenti installati con HBase questa versione, consulta Versioni dei componenti della release 6.15.0.

HBaseinformazioni sulla versione per emr-6.15.0
Etichetta EMR di rilascio Amazon HBaseVersione Componenti installati con HBase

emr-6.15.0

HBase 2.4.17

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server

Nota

Apache HBase HBCK2 è uno strumento operativo separato per la riparazione di HBase regioni e tabelle di sistema. Nella EMR versione 6.1.0 e successive di Amazon, hbase-hbck2.jar viene fornito nel /usr/lib/hbase-operator-tools/ nodo primario. Per ulteriori informazioni su come creare e utilizzare lo strumento, consulta HBaseHBCK2.

La tabella seguente elenca la versione HBase inclusa nell'ultima versione della serie Amazon EMR 5.x, insieme ai componenti con cui Amazon si EMR installa. HBase

Per la versione dei componenti installati con HBase questa versione, consulta Versioni dei componenti della release 5.36.2.

HBaseinformazioni sulla versione per emr-5.36.2
Etichetta EMR di rilascio Amazon HBaseVersione Componenti installati con HBase

emr-5.36.2

HBase 1.4.13

emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server