Blok Kapasitas untuk ML - Amazon Elastic Compute Cloud

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Blok Kapasitas untuk ML

Blok Kapasitas untuk ML memungkinkan Anda untuk memesan instans GPU yang sangat dicari di masa mendatang untuk mendukung beban kerja machine learning (ML) berdurasi pendek. Instans yang berjalan di dalam Blok Kapasitas secara otomatis ditempatkan berdekatan di dalam Amazon UltraClusters EC2, untuk jaringan latensi rendah, skala petabit, dan tanpa pemblokiran.

Dengan Blok Kapasitas, Anda dapat melihat kapan kapasitas instans GPU tersedia di masa mendatang, dan Anda dapat menjadwalkan Blok Kapasitas untuk memulai pada waktu yang paling sesuai untuk Anda. Saat Anda memesan Blok Kapasitas, Anda mendapatkan jaminan kapasitas yang dapat diprediksi untuk instans GPU dengan membayar jumlah waktu yang Anda butuhkan saja. Kami merekomendasikan Blok Kapasitas saat Anda membutuhkan GPU untuk mendukung beban kerja ML Anda selama berhari-hari atau berminggu-minggu sekaligus dan tidak ingin membayar reservasi saat instans GPU Anda tidak digunakan.

Berikut ini adalah beberapa kasus penggunaan umum untuk Blok Kapasitas.

  • Pelatihan model ML dan fine-tuning — Dapatkan akses tanpa gangguan ke instans GPU yang Anda pesan untuk menyelesaikan pelatihan model dan fine-tuning.

  • Eksperimen dan prototipe ML — Jalankan eksperimen dan bangun prototipe yang memerlukan instans GPU untuk jangka waktu pendek.

Blok Kapasitas saat ini tersedia untuk p5.48xlarge dan p4d.24xlarge contoh. p5.48xlargeInstans tersedia di Wilayah AS Timur (Ohio) dan AS Timur (Virginia N.). p4d.24xlargeContoh tersedia di Wilayah AS Timur (Ohio) dan AS Barat (Oregon). Anda dapat memesan Blok Kapasitas dengan waktu mulai reservasi hingga delapan minggu ke depan.

Anda dapat menggunakan Blok Kapasitas untuk melakukan reservasi p5 dan p4d instans dengan opsi durasi reservasi dan kuantitas instans berikut.

  • Durasi reservasi untuk kenaikan 1 hari hingga total 14 hari

  • Opsi kuantitas instans reservasi dari 1, 2, 4, 8, 16, 32, atau 64 instans

Untuk memesan Blok Kapasitas, Anda mulai dengan menentukan kebutuhan kapasitas Anda, termasuk jenis instans, jumlah instans, jumlah waktu, tanggal mulai paling awal, dan tanggal akhir terbaru yang Anda butuhkan. Kemudian, Anda dapat melihat penawaran Blok Kapasitas yang tersedia yang memenuhi spesifikasi Anda. Penawaran Blok Kapasitas mencakup detail seperti waktu mulai, Zona Ketersediaan, dan harga reservasi. Harga penawaran Blok Kapasitas tergantung pada penawaran dan permintaan yang tersedia pada saat penawaran dikirimkan. Setelah Anda memesan Blok Kapasitas, harga tidak berubah. Untuk informasi selengkapnya, lihat Harga dan penagihan Blok Kapasitas.

Saat Anda membeli penawaran Blok Kapasitas, reservasi dibuat sesuai tanggal dan jumlah instans yang Anda pilih. Saat reservasi Blok Kapasitas dimulai, Anda dapat menargetkan peluncuran instans dengan menentukan ID reservasi dalam permintaan peluncuran.

Anda dapat menggunakan semua instans yang Anda pesan hingga 30 menit sebelum waktu Blok Kapasitas berakhir. Dengan 30 menit tersisa di reservasi Blok Kapasitas Anda, kami mulai menghentikan semua instans yang berjalan di Blok Kapasitas. Kami menggunakan waktu ini untuk membersihkan instans Anda sebelum mengirimkan Blok Kapasitas ke pelanggan berikutnya. 30 menit terakhir reservasi tidak dikenai biaya dalam harga Blok Kapasitas. Kami memancarkan acara melalui EventBridge 10 menit sebelum proses penghentian dimulai. Untuk informasi selengkapnya, lihat Monitor Blok Kapasitas dengan EventBridge.

Platform yang didukung

Blok Kapasitas untuk ML saat ini mendukung p5.48xlarge dan p4d.24xlarge instance dengan penyewaan default. Saat Anda menggunakan AWS Management Console untuk membeli Blok Kapasitas, opsi platform default adalah Linux/UNIX. Saat Anda menggunakan AWS Command Line Interface (AWS CLI) atau AWS SDK untuk membeli Blok Kapasitas, opsi platform berikut tersedia:

  • Linux/UNIX

  • Linux Red Hat Enterprise

  • RHEL dengan HA

  • SUSE Linux

  • Ubuntu Pro

Pertimbangan

Sebelum Anda menggunakan Blok Kapasitas, pertimbangkan detail dan batasan berikut.

  • Blok Kapasitas dimulai dan diakhiri pada pukul 11:30 Waktu Universal Terkoordinasi (UTC).

  • Proses pengakhiran untuk instans yang berjalan di Blok Kapasitas dimulai pada pukul 11:00 Waktu Universal Terkoordinasi (UTC) pada hari terakhir reservasi.

  • Blok Kapasitas dapat dipesan dengan waktu mulai hingga 8 minggu di masa mendatang.

  • Modifikasi dan pembatalan Blok Kapasitas tidak diizinkan.

  • Blok Kapasitas tidak dapat dibagikan di seluruh akun AWS atau di dalam AWS Organizations.

  • Blok Kapasitas tidak dapat digunakan dalam grup reservasi kapasitas.

  • Jumlah total instans yang dapat dicadangkan di Blok Kapasitas di semua akun di Organisasi AWS Anda tidak dapat melebihi 64 instans pada tanggal tertentu.

  • Untuk menggunakan Blok Kapasitas, instans harus secara khusus menargetkan ID reservasi.

  • Instans dalam Blok Kapasitas tidak diperhitungkan dalam batas Instans Sesuai Permintaan Anda.

Untuk mempelajari cara meluncurkan instans ke dalam Blok Kapasitas saat Anda membuat grup Auto Scaling, lihat Meluncurkan instans ke Blok Kapasitas untuk ML di Panduan Pengguna Amazon EC2 Auto Scaling.

Anda juga dapat menemukan konten pemecahan masalah untuk masalah peluncuran instans yang mungkin terjadi di grup Auto Scaling di Memecahkan Masalah Amazon EC2 Auto Scaling di Panduan Pengguna Auto Scaling Amazon EC2.

Untuk mempelajari cara menggunakan Blok Kapasitas dengan Amazon EKS, lihat Blok Kapasitas untuk ML di Panduan Pengguna Amazon EKS.