Penambalan AMI dan penggantian instans EC2 - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Penambalan AMI dan penggantian instans EC2

Untuk memastikan bahwa semua node komputasi klaster yang diluncurkan secara dinamis berperilaku secara konsisten,AWS ParallelCluster menonaktifkan pembaruan OS otomatis instans klaster. Selain itu, serangkaianAWS ParallelCluster AMI khusus dibuat untuk setiap versiAWS ParallelCluster dan CLI yang terkait. Kumpulan AMI khusus ini tetap tidak berubah dan hanya didukung olehAWS ParallelCluster versi yang mereka buat. AWS ParallelCluster AMI untuk versi yang dirilis tidak diperbarui.

Namun, karena masalah keamanan yang muncul, pelanggan mungkin ingin menambahkan tambalan ke AMI ini dan kemudian memperbarui klaster mereka dengan AMI yang ditambal. Ini sejalan dengan Model Tanggung JawabAWS ParallelCluster Bersama.

Untuk melihat kumpulanAWS ParallelCluster AMI tertentu yang didukung oleh versiAWS ParallelCluster CLI yang sedang Anda gunakan, jalankan:

$ pcluster version $ pcluster list-official-images

NodeAWS ParallelCluster kepala adalah contoh statis dan Anda dapat memperbaruinya secara manual. Restart dan reboot node kepala sepenuhnya didukung dimulai denganAWS ParallelCluster versi 3.0.0.

Jika instans Anda memiliki penyimpanan instans sementara, Anda harus ingat untuk menyimpan data penyimpanan instans sebelum pembaruan manual. Untuk informasi selengkapnya, lihat konfigurasi HeadNodeLocalStorage//EphemeralVolumeklaster dan jenis Instans dengan volume penyimpanan instans di Panduan Pengguna Amazon EC2 untuk Instans Linux.

Node komputasi adalah contoh fana. Secara default Anda hanya dapat mengaksesnya dari node kepala. Dimulai denganAWS ParallelCluster versi 3.0.0, Anda dapat memperbarui AMI yang terkait dengan instance komputasi dengan memodifikasi CustomAmiparameter SchedulingSlurmQueuesImage////dan menjalankanpcluster update-cluster perintah, setelah menghentikan armada komputasi denganpcluster update-compute-fleet:

$ pcluster update-compute-fleet-status --status STOP_REQUESTED

Dimungkinkan untuk mengotomatiskan pembuatan AMI kustom yang diperbarui untuk node komputasi dengan menggunakan salah satu metode berikut:

Pembaruan atau penggantian instans simpul kepala

Dalam beberapa keadaan, Anda mungkin diminta untuk me-restart atau reboot node kepala. Misalnya, ini diperlukan ketika Anda memperbarui OS secara manual, atau ketika ada AWSinstance pensiun yang dijadwalkan yang memaksakan instans head node restart.

Jika instans Anda tidak memiliki drive yang singkat, Anda dapat menghentikannya lagi kapan saja. Dalam kasus pensiun yang dijadwalkan, memulai instance berhenti bermigrasi untuk menggunakan perangkat keras baru.

Demikian pula, Anda dapat menghentikan dan memulai instance secara manual yang tidak memiliki toko instance. Untuk kasus ini dan untuk kasus kasus lain tanpa volume sementara, lanjutkanMenghentikan dan memulai node kepala klaster.

Jika instans Anda memiliki drive sementara dan telah dihentikan, data yang ada dalam penyimpanan produk hilang. Anda dapat menentukan apakah jenis instance yang digunakan untuk node head memiliki instance store dari tabel yang ditemukan di volume toko Instance.

Simpan data dari drive fana

Dimulai denganAWS ParallelCluster versi 3.0.0, head node restart dan reboot sepenuhnya didukung untuk setiap jenis instance. Namun, jika instance memiliki drive fana, datanya hilang. Ikuti langkah selanjutnya untuk menyimpan data Anda sebelum head node restart atau reboot.

Untuk memeriksa apakah Anda memiliki data yang perlu dilestarikan, lihat konten di MountDirfolder EphemeralVolume/(secara/scratch default).

Anda dapat mentransfer data ke volume root atau sistem penyimpanan bersama yang dilampirkan ke klaster, seperti Amazon FSx, Amazon EFS, atau Amazon EBS. Perhatikan bahwa transfer data ke penyimpanan jarak jauh dapat dikenakan biaya tambahan.

Setelah menyimpan data, lanjutkanMenghentikan dan memulai node kepala klaster.

Menghentikan dan memulai node kepala klaster

  1. Verifikasi tidak ada pekerjaan yang berjalan di klaster.

    Saat menggunakanSlurm penjadwal:

    • Jikasbatch--no-requeue opsi tidak ditentukan, pekerjaan yang berjalan akan diminta.

    • Jika--no-requeue opsi ditentukan, menjalankan pekerjaan gagal.

  2. Meminta penghentian armada komputasi klaster:

    $ pcluster update-compute-fleet --cluster-name cluster-name --status STOP_REQUESTED { "status": "STOP_REQUESTED", ... }
  3. Tunggu hingga status armada komputasi adalahSTOPPED:

    $ pcluster update-compute-fleet --cluster-name cluster-name --status STOP_REQUESTED { "status": "STOPPED", ... }
  4. Untuk update manual dengan OS reboot atau contoh restart, Anda dapat menggunakanAWS Management Console atauAWS CLI. Berikut ini adalah contoh penggunaanAWS CLI.

    # Retrieve head node instance id $ pcluster describe-cluster --cluster-name cluster-name --status STOP_REQUESTED { "headNode": { "instanceId": "i-1234567890abcdef0", ... }, ... } # stop and start the instance $ aws ec2 stop-instances --instance-ids 1234567890abcdef0 { "StoppingInstances": [ { "CurrentState": { "Name": "stopping" ... }, "InstanceId": "i-1234567890abcdef0", "PreviousState": { "Name": "running" ... } } ] } $ aws ec2 start-instances --instance-ids 1234567890abcdef0 { "StartingInstances": [ { "CurrentState": { "Name": "pending" ... }, "InstanceId": "i-1234567890abcdef0", "PreviousState": { "Name": "stopped" ... } } ] }
  5. Mulai armada komputasi cluster:

    $ pcluster update-compute-fleet --cluster-name cluster-name --status START_REQUESTED { "status": "START_REQUESTED", ... }