設定叢集軟體 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定叢集軟體

當您選取軟體版本時,Amazon EMR 會使用 Amazon Machine Image (AMI) 與 Amazon Linux 以在您啟動叢集時安裝您選擇的軟體,例如 Hadoop、Spark 和 Hive。Amazon EMR 會定期提供新版本、新增新功能、新應用程式和一般更新。我們建議您盡可能使用最新的版本來啟動您的叢集。當您從主控台啟動叢集時,最新版本為預設選項。

如需有關 Amazon EMR 發行和每次發行時可用軟體版本的詳細資訊,請移至 Amazon EMR 版本指南。如需有關如何編輯安裝在叢集中的應用程式和軟體預設組態的詳細資訊,請移至《Amazon EMR 版本指南》中的設定應用程式。有些包含在 Amazon EMR 版本的開放原始碼 Hadoop 和 Spark 版本生態系統元件擁有修補程式和改進功能,這些都記載在 Amazon EMR 版本指南中。

除了可安裝在您叢集上的標準軟體和應用程式外,您可以使用引導操作來安裝自訂軟體。引導操做為叢集啟動時在執行個體上執行的指令碼,且是在叢集建立時新增的新節點上執行。啟動程序動作對於叫用每個節點上的 AWS CLI 命令,將物件從 Amazon S3 複製到叢集中的每個節點也很有用。

注意

引導操作在 Amazon EMR 4.x 版和更新版本中的使用方式不同。如需有關這些 Amazon EMR AMI 版本 2.x 和 3.x 差異的詳細資訊,請移至《Amazon EMR 版本指南》中的 4.x 差異介紹