Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konfigurasikan Plugin Filter CLI Slurm pada cluster PCS AWS
Konfigurasikan Plugin Filter CLI saat Anda membuat cluster PCS baru AWS . Anda dapat mengaktifkan atau menonaktifkan Plugin Filter CLI pada cluster yang ada menggunakan API Pembaruan atau konsol tanpa membuat ulang cluster.
Prasyarat
Sebelum Anda mengkonfigurasi Plugin Filter CLI, selesaikan tugas-tugas ini:
-
Tulis dan uji skrip Lua yang mengimplementasikan CLI Filter Plugin API
-
Beri nama skrip Lua Anda dengan tepat
cli_filter.lua -
Pilih metode untuk menyebarkan skrip Anda ke semua instance cluster (AMI, S3, atau sistem file)
-
Verifikasi Anda menggunakan Slurm versi 24.11 atau yang lebih baru
Aktifkan Plugin Filter CLI pada cluster baru
Menyebarkan skrip Plugin Filter CLI
Untuk menyebarkan skrip Plugin Filter CLI ke cluster Anda
-
Pastikan semua yang AMIs digunakan dalam grup node komputasi memiliki Slurm diinstal melalui penginstal AWS PCS Slurm.
catatan
Jika Anda menggunakan AWS PCS Sample AMI untuk semua grup node komputasi, lewati langkah ini. Slurm sudah diinstal.
-
Terapkan
cli_filter.luaskrip Anda ke/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luasemua instance di cluster.Misalnya, untuk Slurm versi 24.11:
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
Luncurkan semua login dan hitung node menggunakan siap AMIs Anda.
-
Uji pengajuan pekerjaan untuk memverifikasi Plugin Filter CLI dijalankan dengan benar.
Mengaktifkan atau menonaktifkan Plugin Filter CLI pada cluster yang ada
Anda dapat mengaktifkan atau menonaktifkan Plugin Filter CLI pada cluster yang ada tanpa membangun kembali infrastruktur Anda. Untuk informasi selengkapnya, lihat Memperbarui cluster di AWS PCS.
Hasil yang diharapkan
Setelah Anda menyelesaikan konfigurasi:
-
Cluster Anda dibuat dengan Plugin Filter CLI diaktifkan
-
Pengajuan Job memicu logika validasi kustom Anda sebelum mencapai pengontrol Slurm
-
Pekerjaan yang tidak sesuai ditolak dengan pesan kesalahan khusus Anda
-
Pekerjaan yang sesuai berjalan normal melalui penjadwal Slurm
Pemecahan masalah
- Skrip Plugin Filter CLI hilang pada node apa pun
-
Gejala: Pengajuan Job segera gagal dengan kesalahan pemuatan plugin.
Kemungkinan penyebabnya: Skrip tidak diterapkan ke semua instance atau jalur atau nama file yang salah.
Resolusi: Verifikasi skrip ada di jalur yang benar pada semua node login dan komputasi dengan nama file
cli_filter.luayang tepat. - Konfigurasi Plugin Filter CLI tidak valid
-
Gejala: Pembuatan cluster gagal dengan kesalahan validasi.
Kemungkinan penyebab:
CliFilterPluginsparameter tidak disetel kecli_filter/luaformat.Resolusi: Gunakan nilai parameter yang tepat
cli_filter/luadislurmCustomSettings.