開始使用 AWS PCS - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

開始使用 AWS PCS

這是一個教程來創建一個簡單的集群,你可以用來嘗試 AWS PCS。下圖顯示了集群的設計。

教學課程叢集的架構圖:2 個計算節點群組是您 AWS 帳戶 的資源,可連接至以服務擁有的 Slurm 叢集控制器執行。 AWS 帳戶兩個運算節點群組中的EC2執行個體都會連接到 Amazon EFS 和 Amazon (適用FSx於 Lustre) 的共享儲存體。

本教程集群設計具有以下關鍵組成部分:

  • 符合網AWS PCS路需求的 A VPC 和子網路

  • Amazon EFS 檔案系統,將用作共用主目錄。

  • 一個 Amazon FSx 的 Lustre 文件系統,它提供了一個共享的高性能目錄。

  • 一個 AWS PCS集群,它提供了一個 Slurm 控制器。

  • 2 個運算節點群組。

    • login節點群組,提供對系統的殼層型互動式存取。

    • compute-1節點群組提供彈性調整規模的執行個體以執行作業。

  • 1 個佇列,可將工作傳送至compute-1節點群組中的EC2執行個體。

叢集需要其他 AWS 資源,例如安全群組、IAM角色和EC2啟動範本,這些資源不會顯示在圖表中。