Catatan rilis untuk versi Slurm di PCS AWS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Catatan rilis untuk versi Slurm di PCS AWS

Topik ini menjelaskan perubahan penting untuk setiap versi Slurm yang saat ini didukung di AWS PCS. Kami sarankan Anda meninjau perubahan antara versi lama dan baru saat Anda meng-upgrade klaster Anda.

Perubahan diterapkan di AWS PCS

Untuk informasi lebih lanjut tentang Slurm 24.11, lihat publikasi berikut:

Perubahan diterapkan di AWS PCS
  • Modul Slurm Step Manager baru sekarang diaktifkan secara default di AWS PCS. Modul ini memberikan manfaat yang signifikan dengan membongkar manajemen langkah dari pengontrol pusat ke node komputasi, secara substansional meningkatkan konkurensi sistem di lingkungan dengan penggunaan langkah berat. Untuk mendukung konfigurasi ini dan mengisolasi Prolog dan Epilog memproses eksekusi yang lebih baik, flag prolog baru (Contain,Alloc) diaktifkan.

  • Komunikasi hierarkis dari pengontrol ke node komputasi diaktifkan untuk mengoptimalkan komunikasi intra-node Slurm, yang meningkatkan skalabilitas dan kinerja. Selain itu, konfigurasi routing sekarang menggunakan daftar node partisi untuk komunikasi dari controller, bukan algoritma routing default plugin, meningkatkan ketahanan sistem.

  • Plugin hash baru HashPlugin=hash/sha3 menggantikan yang sebelumnya. hash/k12 plugin Ini sekarang diaktifkan secara default di cluster AWS PCS.

  • Log pengontrol slurm sekarang menyertakan kemampuan audit yang ditingkatkan untuk semua panggilan prosedur jarak jauh masuk (RPC) ke. slurmctld Log termasuk alamat sumber, pengguna yang diautentikasi, dan jenis RPC sebelum pemrosesan koneksi.

Untuk informasi lebih lanjut tentang Slurm 24.05, lihat publikasi berikut:

Pengaturan slurm yang dapat Anda ubah di PCS AWS
  • SuspendTimeDefaultnya ke. 60 Gunakan parameter scaleDownIdleTimeInSeconds konfigurasi AWS PCS untuk mengaturnya. Untuk informasi selengkapnya, lihat scaleDownIdleTimeInSecondsparameter tipe ClusterSlurmConfiguration data di Referensi AWS PCS API.

  • MaxJobCountDan MaxArraySize didasarkan pada ukuran yang Anda pilih untuk cluster. Untuk informasi selengkapnya, lihat sizeparameter aksi CreateCluster API di Referensi AWS PCS API.

  • Pengaturan SelectTypeParameters Slurm default ke. CR_CPU Anda dapat memberikannya sebagai nilai untuk slurmCustomSettings mengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihat slurmCustomSettingsparameter aksi CreateCluster API dan SlurmCustomSettingReferensi AWS PCS API.

  • Anda dapat mengatur Prolog dan Epilog pada tingkat cluster. Anda dapat memberikannya sebagai nilai untuk slurmCustomSettings mengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihat CreateClusterdan SlurmCustomSettingdi Referensi AWS PCS API.

  • Anda dapat mengatur Weight dan RealMemory pada tingkat grup node komputasi. Anda dapat memberikannya sebagai nilai slurmCustomSettings untuk mengaturnya saat Anda membuat grup node komputasi. Untuk informasi selengkapnya, lihat CreateComputeNodeGroupdan SlurmCustomSettingdi Referensi AWS PCS API.