AWS PCS 中的 Slurm REST API - AWS PCS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS PCS 中的 Slurm REST API

AWS PCS 透過 為 Slurm 的原生 REST API 提供受管支援slurmrestd,為程式設計叢集互動提供 HTTP 界面。您可以透過標準 HTTP 請求提交任務、監控叢集狀態和管理資源,而不需要直接透過 shell 存取叢集。

常用案例

Slurm REST API 支援各種整合案例:

  • Web 應用程式整合:建置自訂前端和 Web 應用程式,以直接提交和管理任務。

  • Jupyter 筆記本整合:允許研究人員從筆記本環境提交任務,而不會離開其開發工作流程。

  • 合作夥伴解決方案整合:將第三方 HPC 工具和工作流程管理員連接到 AWS PCS 叢集。

  • 程式設計叢集管理:自動化任務提交、監控和資源管理工作流程。

  • 研究運算工作流程:支援需要 API 驅動型任務管理的學術和企業研究環境。

要求與限制

使用 Slurm REST API 之前,請檢閱下列詳細資訊:

  • 您的叢集必須使用 Slurm 25.05 版或更新版本。

  • API 端點只能透過叢集 VPC 內的私有 IP 地址存取。

  • 您的叢集安全群組必須允許連接埠 6820 上的 HTTP 流量。

  • 身分驗證需要具有特定使用者身分宣告的 JWT 字符。

目前的限制包括:

  • scontrol token 不支援 產生的字符。

  • X-SLURM-USER-NAME 標頭模擬不可用。

  • 某些功能需要啟用 Slurm 會計。

  • 與 Slurm CLI 篩選條件外掛程式機制不相容。

  • 與 REST API 端點的連線不會使用 TLS 加密。