使用 HBase 建立叢集 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 HBase 建立叢集

本節中的程序涵蓋使用 AWS Management Console 和啟動叢集的基本概念 AWS CLI。如需如何規劃、設定和啟動 Amazon EMR 叢集的詳細資訊,請參閱《Amazon EMR 管理指南》中的規劃和設定叢集

使用主控台透過 HBase 來建立叢集

如需使用主控台啟動叢集的快速步驟,請參閱《Amazon EMR 管理指南》中的 Amazon EMR 入門

使用主控台並透過安裝好的 HBase 來啟動叢集

  1. 打開 Amazon EMR 控制台,網址為 https://console.aws.amazon.com/emr

  2. 選擇 Create cluster (建立叢集),然後選取 Go to advanced options (前往進階選項)

  3. Software Configuration (軟體組態) 中,選擇 4.6.0 或更新的 Amazon 發行版本 (建議使用最新版本)。視需求選擇 HBase (HBase) 和其他應用程式。

  4. 在 Amazon EMR 5.2.0 和更新版本中,移至 HBase 儲存設定下,選取 HDFSS3。如需詳細資訊,請參閱 HBase on Amazon S3 (Amazon S3 儲存模式)

  5. 依需要選取其他選項,然後選擇 Create cluster (建立叢集)

使用建立具有 HBase 的叢集 AWS CLI

透過已安裝的 HBase 使用以下列命令來建立叢集:

aws emr create-cluster --name "Test cluster" --release-label emr-7.1.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m5.xlarge --instance-count 3
注意

包含 Linux 行接續字元 (\) 是為了提高可讀性。它們可以在 Linux 命令中移除或使用。對於 Windows,請將其移除或取代為插入符號 (^)。

如果您使用 HBase on Amazon S3,請參考 JSON 組態物件來指定 --configurations 選項。組態物件必須包含指定 Amazon S3 位置的 hbase-site 分類,即使用 hbase.rootdir 屬性儲存 HBase 資料的位置。它也必須包含使用 hbase 屬性來指定 s3hbase.emr.storageMode 分類。以下範例示範使用這些組態設定的 JSON 片段。

[ { "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore" } }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode": "s3" } } ]

如需有關 HBase on Amazon S3 的詳細資訊,請參閱 HBase on Amazon S3 (Amazon S3 儲存模式)。如需分類的詳細資訊,請參閱 設定應用程式