Versionshinweise für Slurm-Versionen in AWS PCS - AWS PCS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionshinweise für Slurm-Versionen in AWS PCS

Dieses Thema beschreibt wichtige Änderungen für jede Slurm-Version, die derzeit in AWS PCS unterstützt wird. Wir empfehlen Ihnen, die Änderungen zwischen der alten und der neuen Version zu überprüfen, wenn Sie Ihren Cluster aktualisieren.

In PCS implementierte Änderungen AWS

Weitere Informationen zu Slurm 24.11 finden Sie in den folgenden Veröffentlichungen:

In PCS implementierte Änderungen AWS
  • Das neue Slurm Step Manager-Modul ist jetzt standardmäßig in AWS PCS aktiviert. Dieses Modul bietet erhebliche Vorteile, da das Schrittmanagement vom zentralen Controller auf die Rechenknoten verlagert wird, wodurch die Parallelität der Systeme in Umgebungen mit starker Schrittnutzung erheblich verbessert wird. Um diese Konfiguration zu unterstützen und die Ausführung besser zu isolieren Prolog und zu Epilog verarbeiten, wurden neue Prolog-Flags (Contain,Alloc) aktiviert.

  • Die hierarchische Kommunikation vom Controller zu den Rechenknoten wird aktiviert, um die Kommunikation zwischen Slurm-Knoten zu optimieren und so die Skalierbarkeit und Leistung zu verbessern. Darüber hinaus verwendet die Routing-Konfiguration jetzt Partitionsknotenlisten für die Kommunikation vom Controller anstelle des Standard-Routing-Algorithmus des Plugins, wodurch die Systemstabilität verbessert wird.

  • Ein neues Hash-Plugin HashPlugin=hash/sha3 ersetzt das vorherigehash/k12 plugin. Dies ist jetzt standardmäßig in AWS PCS-Clustern aktiviert.

  • Die Slurm-Controller-Logs enthalten jetzt erweiterte Auditing-Funktionen für alle eingehenden Remote Procedure Calls (RPC). slurmctld Die Protokolle enthalten die Quelladresse, den authentifizierten Benutzer und den RPC-Typ vor der Verbindungsverarbeitung.

Weitere Informationen zu Slurm 24.05 finden Sie in den folgenden Veröffentlichungen:

Slurm-Einstellungen, die Sie in PCS ändern können AWS
  • Die SuspendTime Standardeinstellung ist. 60 Verwenden Sie den AWS scaleDownIdleTimeInSeconds PCS-Konfigurationsparameter, um ihn festzulegen. Weitere Informationen finden Sie unter dem scaleDownIdleTimeInSecondsParameter des ClusterSlurmConfiguration Datentyps in der AWS PCS-API-Referenz.

  • Der MaxJobCount Wert und MaxArraySize basiert auf der Größe, die Sie für den Cluster auswählen. Weitere Informationen finden Sie unter dem sizeParameter der CreateCluster API-Aktion in der AWS PCS-API-Referenz.

  • Die SelectTypeParameters Slurm-Einstellung ist standardmäßig auf. CR_CPU Sie können ihn als Wert angeben, slurmCustomSettings um ihn bei der Erstellung eines Clusters festzulegen. Weitere Informationen finden Sie im slurmCustomSettingsParameter der CreateCluster API-Aktion und SlurmCustomSettingin der AWS PCS-API-Referenz.

  • Sie können Prolog und Epilog auf Clusterebene festlegen. Sie können es als Wert angebenslurmCustomSettings, um es festzulegen, wenn Sie einen Cluster erstellen. Weitere Informationen finden Sie unter CreateClusterund SlurmCustomSettingin der AWS PCS-API-Referenz.

  • Sie können Weight und RealMemory auf der Ebene der Compute-Knotengruppen festlegen. Sie können es als Wert angeben, slurmCustomSettings um es festzulegen, wenn Sie eine Compute-Knotengruppe erstellen. Weitere Informationen finden Sie unter CreateComputeNodeGroupund SlurmCustomSettingin der AWS PCS-API-Referenz.