Blok Kapasitas untuk ML - Amazon Elastic Compute Cloud

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blok Kapasitas untuk ML

Blok Kapasitas untuk ML memungkinkan Anda untuk memesan GPU instans yang sangat dicari di masa mendatang untuk mendukung beban kerja machine learning (ML) berdurasi pendek Anda. Instans yang berjalan di dalam Blok Kapasitas secara otomatis ditempatkan berdekatan di dalam Amazon EC2 UltraClusters, untuk jaringan latensi rendah, skala petabit, dan tidak memblokir.

Dengan Blok Kapasitas, Anda dapat melihat kapan kapasitas GPU instans tersedia di masa mendatang, dan Anda dapat menjadwalkan Blok Kapasitas untuk memulai pada waktu yang paling sesuai untuk Anda. Ketika Anda memesan Blok Kapasitas, Anda mendapatkan jaminan kapasitas yang dapat diprediksi untuk GPU instance sambil membayar hanya untuk jumlah waktu yang Anda butuhkan. Kami merekomendasikan Blok Kapasitas saat Anda GPUs perlu mendukung beban kerja ML Anda selama berhari-hari atau berminggu-minggu dan tidak ingin membayar reservasi saat GPU instans Anda tidak digunakan.

Berikut ini adalah beberapa kasus penggunaan umum untuk Blok Kapasitas.

  • Pelatihan dan fine-tuning model ML — Dapatkan akses tanpa gangguan ke GPU instans yang Anda pesan untuk menyelesaikan pelatihan model dan fine-tuning.

  • Eksperimen dan prototipe ML — Jalankan eksperimen dan buat prototipe yang memerlukan GPU instance untuk jangka waktu pendek.

Blok Kapasitas saat ini tersedia untuk p5.48xlarge dan p4d.24xlarge contoh. p5.48xlargeInstans tersedia di Wilayah AS Timur (Ohio) dan AS Timur (Virginia N.). p4d.24xlargeContoh tersedia di Wilayah AS Timur (Ohio) dan AS Barat (Oregon). Anda dapat memesan Blok Kapasitas dengan waktu mulai reservasi hingga delapan minggu ke depan.

Anda dapat menggunakan Blok Kapasitas untuk melakukan reservasi p5 dan p4d instans dengan opsi durasi reservasi dan kuantitas instans berikut.

  • Durasi reservasi untuk kenaikan 1 hari hingga 14 hari dan kenaikan 7 hari hingga total 28 hari

  • Opsi kuantitas instans reservasi dari 1, 2, 4, 8, 16, 32, atau 64 instans

Untuk memesan Blok Kapasitas, Anda mulai dengan menentukan kebutuhan kapasitas Anda, termasuk jenis instans, jumlah instans, jumlah waktu, tanggal mulai paling awal, dan tanggal akhir terbaru yang Anda butuhkan. Kemudian, Anda dapat melihat penawaran Blok Kapasitas yang tersedia yang memenuhi spesifikasi Anda. Penawaran Blok Kapasitas mencakup detail seperti waktu mulai, Zona Ketersediaan, dan harga reservasi. Harga penawaran Blok Kapasitas tergantung pada penawaran dan permintaan yang tersedia pada saat penawaran dikirimkan. Setelah Anda memesan Blok Kapasitas, harga tidak berubah. Untuk informasi selengkapnya, lihat Harga dan penagihan Blok Kapasitas.

Saat Anda membeli penawaran Blok Kapasitas, reservasi dibuat sesuai tanggal dan jumlah instans yang Anda pilih. Saat reservasi Blok Kapasitas dimulai, Anda dapat menargetkan peluncuran instans dengan menentukan ID reservasi dalam permintaan peluncuran.

Anda dapat menggunakan semua instans yang Anda pesan hingga 30 menit sebelum waktu Blok Kapasitas berakhir. Dengan 30 menit tersisa di reservasi Blok Kapasitas Anda, kami mulai menghentikan semua instans yang berjalan di Blok Kapasitas. Kami menggunakan waktu ini untuk membersihkan instans Anda sebelum mengirimkan Blok Kapasitas ke pelanggan berikutnya. 30 menit terakhir reservasi tidak dikenai biaya dalam harga Blok Kapasitas. Kami memancarkan acara melalui EventBridge 10 menit sebelum proses penghentian dimulai. Untuk informasi selengkapnya, lihat Monitor Blok Kapasitas menggunakan EventBridge.

Platform yang didukung

Blok Kapasitas untuk ML saat ini mendukung p5.48xlarge dan p4d.24xlarge instance dengan penyewaan default. Saat Anda menggunakan AWS Management Console untuk membeli Blok Kapasitas, opsi platform default adalah UNIX Linux/. Saat Anda menggunakan AWS Command Line Interface (AWS CLI) atau AWS SDK untuk membeli Blok Kapasitas, opsi platform berikut tersedia:

  • Linux/UNIX

  • Linux Red Hat Enterprise

  • RHELdengan HA

  • SUSELinux

  • Ubuntu Pro

Pertimbangan

Sebelum Anda menggunakan Blok Kapasitas, pertimbangkan detail dan batasan berikut.

  • Blok Kapasitas dimulai dan berakhir pada 11:30 Waktu Universal Terkoordinasi ()UTC.

  • Proses penghentian untuk instans yang berjalan di Blok Kapasitas dimulai pada pukul 11:00 Waktu Universal Terkoordinasi (UTC) pada hari terakhir reservasi.

  • Blok Kapasitas dapat dipesan dengan waktu mulai hingga 8 minggu di masa mendatang.

  • Modifikasi dan pembatalan Blok Kapasitas tidak diizinkan.

  • Blok Kapasitas tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.

  • Blok Kapasitas tidak dapat digunakan dalam grup reservasi kapasitas.

  • Jumlah total instans yang dapat dicadangkan di Blok Kapasitas di semua akun di AWS Organisasi Anda tidak dapat melebihi 64 instans pada tanggal tertentu.

  • Untuk menggunakan Blok Kapasitas, instans harus secara khusus menargetkan ID reservasi.

  • Instans dalam Blok Kapasitas tidak diperhitungkan dalam batas Instans Sesuai Permintaan Anda.

  • Untuk instans P5 yang menggunakan kustomAMI, pastikan Anda memiliki perangkat lunak dan konfigurasi yang diperlukan. EFA

  • Untuk grup simpul EKS terkelola Amazon, lihat Membuat grup simpul terkelola dengan Blok EC2 Kapasitas Amazon untuk ML. Untuk grup node yang EKS dikelola sendiri Amazon, lihat Menggunakan Blok Kapasitas untuk MLdengan node yang dikelola sendiri.

Setelah Anda membuat Blok Kapasitas, Anda dapat melakukan hal berikut dengan Blok Kapasitas:

Untuk informasi lebih lanjut tentang AWS ParallelCluster, lihat Apa itu AWS ParallelCluster.