使用 Amazon EMR 管理主控台向叢集新增步驟 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon EMR 管理主控台向叢集新增步驟

透過 AWS Management Console,使用下列程序將步驟新增至叢集。如需有關如何針對特定巨量資料應用程式提交步驟的詳細資訊,請參閱 Amazon EMR 版本指南的以下各節:

在叢集建立期間新增步驟

您可以在 AWS Management Console建立叢集時新增步驟。

Console
使用主控台建立叢集時新增步驟
  1. 登錄到 AWS Management Console, 並打開 Amazon EMR 控制台 https://console.aws.amazon.com/emr.

  2. EC2在左側導覽窗格的 [開EMR啟] 下,選擇 [集],然後選擇 [建立叢集]。

  3. 步驟下,選擇新增步驟。在新增步驟對話方塊的欄位中輸入適當的值。如需有關格式化步驟引數的資訊,請參閱 新增步驟引數。選項視步驟類型而異。若要新增步驟並結束對話方塊,請選取新增步驟

  4. 選擇適用於您的叢集的任何其他選項。

  5. 若要啟動您的叢集,請選擇建立叢集

將步驟新增至執行中的叢集

使用 AWS Management Console,您可以在停用自動終止選項的情況下將步驟新增至叢集。

Console
使用主控台將步驟新增至執行中的叢集
  1. 登錄到 AWS Management Console, 並打開 Amazon EMR 控制台 https://console.aws.amazon.com/emr.

  2. EC2在左側導覽窗格的 [開EMR啟] 下,選擇 [叢集],然後選取您要更新的叢集。

  3. 在叢集詳細資訊頁面的步驟索引標籤中,選取新增步驟。若要複製現有步驟,請選擇動作下拉式功能表,然後選取複製步驟

  4. 新增步驟對話方塊的欄位中輸入適當的值。選項視步驟類型而異。若要新增步驟並結束對話方塊,請選擇新增步驟

在執行中的叢集中修改步驟並行層級

使用 AWS Management Console,您可以在執行中的叢集中修改步驟並行層級。

注意

您只能與 Amazon 5.28.0 及更高EMR版本 parallel 執行多個步驟。

Console
使用主控台修改執行中叢集中的步驟並行
  1. 登錄到 AWS Management Console, 並打開 Amazon EMR 控制台 https://console.aws.amazon.com/emr.

  2. EC2在左側導覽窗格的 [開EMR啟] 下,選擇 [叢集],然後選取您要更新的叢集。叢集必須在執行中,才能變更其並行屬性。

  3. 在叢集詳細資訊頁面的步驟索引標籤上,尋找屬性區段。選取編輯來變更並行。請輸入 1 到 256 之間的值。

新增步驟引數

使用將步驟新增 AWS Management Console 至叢集時,可以在「引數」欄位中指定該步驟的引數。必須使用空格分隔引數,並用引號括住由字元空格組成的字串引數。

範例 :正確引數

下列範例引數的格式正確 AWS Management Console,並在最後一個字串引數周圍加上引號。

bash -c "aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh ."

還可以將每個引數放在單獨的行中以提高可讀性,如以下範例所示。

bash -c "aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh ."
範例 :不正確引數

AWS Management Console的下列範例引數格式不正確。請注意,最後一個字串引數 aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh . 包含空白字元,並且未用引號括住。

bash -c aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh .