步驟 3 – 安裝 Slurm - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 3 – 安裝 Slurm

安裝與 AWS PCS 相容的 Slurm 版本。

注意

如果您的 AMI 已安裝舊版 Slurm 軟體,則必須執行下列步驟來安裝新版 Slurm。根據叢集建立時間設定的 Slurm 版本, AWS PCS 代理程式會在執行時間啟用正確的 Slurm 二進位檔版本。

安裝 Slurm
  1. 連接至安裝 AWS PCS 軟體的相同臨時執行個體。

  2. 下載 Slurm 安裝程式軟體。Slurm 安裝程式封裝在壓縮的 tarball (.tar.gz) 檔案中。若要下載最新穩定版本,請使用下列命令:使用臨時執行個體 AWS 區域 的 取代區域,例如 us-east-1

    curl https://aws-pcs-repo-region.s3.amazonaws.com/aws-pcs-slurm/aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz \ -o aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz

    您也可以在上述命令latest中,將版本編號取代為 ,以取得最新版本 (例如:aws-pcs-slurm-24.05-installer-latest.tar.gz)。

    注意

    這可能會在 Slurm 安裝程式軟體的未來版本中變更。

  3. (選用) 驗證 Slurm 安裝程式 tarball 的真實性和完整性。我們建議您執行這項操作來確認軟體發布者的身分,並檢查檔案自發行以來並未遭到變更或損毀。

    1. 下載 AWS PCS 的公有 GPG 金鑰,並將其匯入您的 keyring。使用您啟動暫時執行個體 AWS 區域 的 取代區域。命令應傳回金鑰值。記錄金鑰值;您可以在下一個步驟中使用它。

      wget https://aws-pcs-repo-public-keys-region.s3.amazonaws.com/aws-pcs-public-key.pub && \ gpg --import aws-pcs-public-key.pub
    2. 執行下列命令來驗證 GPG 金鑰的指紋。

      gpg --fingerprint 7EEF030EDDF5C21C

      命令應該會傳回與下列項目相同的指紋:

      1C24 32C1 862F 64D1 F90A 239A 7EEF 030E DDF5 C21C
      重要

      如果指紋不相符,請勿執行 Slurm 安裝指令碼。聯絡 AWS 支援

    3. 下載簽章檔案並驗證 Slurm 安裝程式 tarball 檔案的簽章。將區域取代為您啟動暫時執行個體 AWS 區域 的 ,例如 us-east-1

      wget https://aws-pcs-repo-region.s3.amazonaws.com/aws-pcs-slurm/aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz.sig && \ gpg --verify ./aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz.sig

      輸出格式應類似以下內容:

      gpg: assuming signed data in './aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz'
      gpg: Signature made Wed Dec 18 14:23:38 2024 CEST
      gpg:                using RSA key 4BAA531875430EB0739E6D961BA7F0AF6E34C496
      gpg: Good signature from "AWS PCS Packages (AWS PCS Packages)" [unknown]
      gpg: WARNING: This key is not certified with a trusted signature!
      gpg:          There is no indication that the signature belongs to the owner.
      Primary key fingerprint: 1C24 32C1 862F 64D1 F90A  239A 7EEF 030E DDF5 C21C
         Subkey fingerprint: 4BAA 5318 7543 0EB0 739E  6D96 1BA7 F0AF 6E34 C496

      如果結果包含 ,Good signature且指紋符合上一個步驟中傳回的指紋,請繼續下一個步驟。

      重要

      如果指紋不相符,請勿執行 Slurm 安裝指令碼。聯絡 AWS 支援

  4. 從壓縮的 .tar.gz 檔案中解壓縮檔案,然後導覽至解壓縮的目錄。

    tar -xf aws-pcs-slurm-24.05-installer-24.05.5-2.tar.gz && \ cd aws-pcs-slurm-24.05-installer
  5. 安裝 Slurm。安裝程式會下載、編譯和安裝 Slurm 及其相依性。視您選取的暫時執行個體規格而定,這需要幾分鐘的時間。

    sudo ./installer.sh -y
  6. 檢查排程器版本檔案以確認安裝。

    cat /opt/aws/pcs/scheduler/slurm-24.05/version

    輸出格式應類似以下內容:

    SLURM_INSTALL_DATE='Wed Dec 18 12:38:56 UTC 2024'
    SLURM_VERSION='24.05.5'
    PCS_SLURM_RELEASE='2'