Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Versionshinweise für Slurm-Versionen in AWS PCS
Dieses Thema beschreibt wichtige Änderungen für jede Slurm-Version, die derzeit in AWS PCS unterstützt wird. Wir empfehlen Ihnen, die Änderungen zwischen der alten und der neuen Version zu überprüfen, wenn Sie Ihren Cluster aktualisieren.
In PCS implementierte Änderungen AWS
-
AWS PCS unterstützt Slurm Accounting. Weitere Informationen finden Sie unter Slurm-Buchhaltung in AWS PCS.
Weitere Informationen zu Slurm 24.11 finden Sie in den folgenden Veröffentlichungen:
In PCS implementierte Änderungen AWS
-
Das neue Slurm Step Manager-Modul ist jetzt standardmäßig in AWS PCS aktiviert. Dieses Modul bietet erhebliche Vorteile, da das Schrittmanagement vom zentralen Controller auf die Rechenknoten verlagert wird, wodurch die Parallelität der Systeme in Umgebungen mit starker Schrittnutzung erheblich verbessert wird. Um diese Konfiguration zu unterstützen und die Ausführung besser zu isolieren
Prolog
und zuEpilog
verarbeiten, wurden neue Prolog-Flags (Contain
,Alloc
) aktiviert. -
Die hierarchische Kommunikation vom Controller zu den Rechenknoten wird aktiviert, um die Kommunikation zwischen Slurm-Knoten zu optimieren und so die Skalierbarkeit und Leistung zu verbessern. Darüber hinaus verwendet die Routing-Konfiguration jetzt Partitionsknotenlisten für die Kommunikation vom Controller anstelle des Standard-Routing-Algorithmus des Plugins, wodurch die Systemstabilität verbessert wird.
-
Ein neues Hash-Plugin
HashPlugin=hash/sha3
ersetzt das vorherigehash/k12 plugin
. Dies ist jetzt standardmäßig in AWS PCS-Clustern aktiviert. -
Die Slurm-Controller-Logs enthalten jetzt erweiterte Auditing-Funktionen für alle eingehenden Remote Procedure Calls (RPC).
slurmctld
Die Protokolle enthalten die Quelladresse, den authentifizierten Benutzer und den RPC-Typ vor der Verbindungsverarbeitung.
Weitere Informationen zu Slurm 24.05 finden Sie in den folgenden Veröffentlichungen:
Slurm-Einstellungen, die Sie in PCS ändern können AWS
-
Die
SuspendTime
Standardeinstellung ist.60
Verwenden Sie den AWSscaleDownIdleTimeInSeconds
PCS-Konfigurationsparameter, um ihn festzulegen. Weitere Informationen finden Sie unter demscaleDownIdleTimeInSeconds
Parameter desClusterSlurmConfiguration
Datentyps in der AWS PCS-API-Referenz. -
Der
MaxJobCount
Wert undMaxArraySize
basiert auf der Größe, die Sie für den Cluster auswählen. Weitere Informationen finden Sie unter demsize
Parameter derCreateCluster
API-Aktion in der AWS PCS-API-Referenz. -
Die
SelectTypeParameters
Slurm-Einstellung ist standardmäßig auf.CR_CPU
Sie können ihn als Wert angeben,slurmCustomSettings
um ihn bei der Erstellung eines Clusters festzulegen. Weitere Informationen finden Sie imslurmCustomSettings
Parameter derCreateCluster
API-Aktion und SlurmCustomSettingin der AWS PCS-API-Referenz. -
Sie können
Prolog
undEpilog
auf Clusterebene festlegen. Sie können es als Wert angebenslurmCustomSettings
, um es festzulegen, wenn Sie einen Cluster erstellen. Weitere Informationen finden Sie unterCreateCluster
und SlurmCustomSettingin der AWS PCS-API-Referenz. -
Sie können
Weight
undRealMemory
auf der Ebene der Compute-Knotengruppen festlegen. Sie können es als Wert angeben,slurmCustomSettings
um es festzulegen, wenn Sie eine Compute-Knotengruppe erstellen. Weitere Informationen finden Sie unterCreateComputeNodeGroup
und SlurmCustomSettingin der AWS PCS-API-Referenz.