Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Catatan rilis untuk versi Slurm di PCS AWS
Topik ini menjelaskan perubahan penting untuk setiap versi Slurm yang saat ini didukung di AWS PCS. Kami sarankan Anda meninjau perubahan antara versi lama dan baru saat Anda meng-upgrade klaster Anda.
Perubahan diterapkan di AWS PCS
-
AWS PCS mendukung akuntansi Slurm. Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.
Untuk informasi lebih lanjut tentang Slurm 24.11, lihat publikasi berikut:
Perubahan diterapkan di AWS PCS
-
Modul Slurm Step Manager baru sekarang diaktifkan secara default di AWS PCS. Modul ini memberikan manfaat yang signifikan dengan membongkar manajemen langkah dari pengontrol pusat ke node komputasi, secara substansional meningkatkan konkurensi sistem di lingkungan dengan penggunaan langkah berat. Untuk mendukung konfigurasi ini dan mengisolasi
Prolog
danEpilog
memproses eksekusi yang lebih baik, flag prolog baru (Contain
,Alloc
) diaktifkan. -
Komunikasi hierarkis dari pengontrol ke node komputasi diaktifkan untuk mengoptimalkan komunikasi intra-node Slurm, yang meningkatkan skalabilitas dan kinerja. Selain itu, konfigurasi routing sekarang menggunakan daftar node partisi untuk komunikasi dari controller, bukan algoritma routing default plugin, meningkatkan ketahanan sistem.
-
Plugin hash baru
HashPlugin=hash/sha3
menggantikan yang sebelumnya.hash/k12 plugin
Ini sekarang diaktifkan secara default di cluster AWS PCS. -
Log pengontrol slurm sekarang menyertakan kemampuan audit yang ditingkatkan untuk semua panggilan prosedur jarak jauh masuk (RPC) ke.
slurmctld
Log termasuk alamat sumber, pengguna yang diautentikasi, dan jenis RPC sebelum pemrosesan koneksi.
Untuk informasi lebih lanjut tentang Slurm 24.05, lihat publikasi berikut:
Pengaturan slurm yang dapat Anda ubah di PCS AWS
-
SuspendTime
Defaultnya ke.60
Gunakan parameterscaleDownIdleTimeInSeconds
konfigurasi AWS PCS untuk mengaturnya. Untuk informasi selengkapnya, lihatscaleDownIdleTimeInSeconds
parameter tipeClusterSlurmConfiguration
data di Referensi AWS PCS API. -
MaxJobCount
DanMaxArraySize
didasarkan pada ukuran yang Anda pilih untuk cluster. Untuk informasi selengkapnya, lihatsize
parameter aksiCreateCluster
API di Referensi AWS PCS API. -
Pengaturan
SelectTypeParameters
Slurm default ke.CR_CPU
Anda dapat memberikannya sebagai nilai untukslurmCustomSettings
mengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihatslurmCustomSettings
parameter aksiCreateCluster
API dan SlurmCustomSettingReferensi AWS PCS API. -
Anda dapat mengatur
Prolog
danEpilog
pada tingkat cluster. Anda dapat memberikannya sebagai nilai untukslurmCustomSettings
mengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihatCreateCluster
dan SlurmCustomSettingdi Referensi AWS PCS API. -
Anda dapat mengatur
Weight
danRealMemory
pada tingkat grup node komputasi. Anda dapat memberikannya sebagai nilaislurmCustomSettings
untuk mengaturnya saat Anda membuat grup node komputasi. Untuk informasi selengkapnya, lihatCreateComputeNodeGroup
dan SlurmCustomSettingdi Referensi AWS PCS API.