Dapatkan instans prospektif instan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dapatkan instans prospektif instan

Inference Recommender juga dapat memberi Anda daftar instance prospektif, atau jenis instans yang mungkin cocok untuk model Anda, di halaman detail model Anda SageMaker . Inference Recommender secara otomatis melakukan benchmarking awal terhadap model Anda agar Anda dapat memberikan lima contoh prospektif teratas. Karena ini adalah rekomendasi awal, kami sarankan Anda menjalankan pekerjaan rekomendasi contoh lebih lanjut untuk mendapatkan hasil yang lebih akurat.

Anda dapat melihat daftar instance prospektif untuk model Anda baik secara terprogram dengan menggunakan, SageMaker SDK Python, DescribeModelAPIatau konsol. SageMaker

catatan

Anda tidak akan mendapatkan contoh prospektif untuk model yang Anda buat SageMaker sebelum fitur ini tersedia.

Untuk melihat instance prospektif model Anda melalui konsol, lakukan hal berikut:

  1. Pergi ke SageMaker konsol di https://console.aws.amazon.com/sagemaker/.

  2. Di panel navigasi kiri, pilih Inferensi, lalu pilih Model.

  3. Dari daftar model, pilih model Anda.

Pada halaman detail untuk model Anda, buka bagian Prospective instance to deploy model. Screenshot berikut menunjukkan bagian ini.

Tangkapan layar dari daftar contoh prospektif pada halaman detail model.

Di bagian ini, Anda dapat melihat instans prospektif yang dioptimalkan untuk biaya, throughput, dan latensi untuk penerapan model, bersama dengan informasi tambahan untuk setiap jenis instans seperti ukuran memori, GPU jumlah, CPU dan biaya per jam.

Jika Anda memutuskan ingin membandingkan muatan sampel dan menjalankan pekerjaan rekomendasi inferensi penuh untuk model Anda, Anda dapat memulai pekerjaan rekomendasi inferensi default dari halaman ini. Untuk memulai pekerjaan default melalui konsol, lakukan hal berikut:

  1. Pada halaman detail model Anda di bagian Prospective instance to deploy model, pilih Run Inference recommended job.

  2. Di kotak dialog yang muncul, untuk bucket S3 untuk benchmarking payload, masukkan lokasi Amazon S3 tempat Anda menyimpan muatan sampel untuk model Anda.

  3. Untuk jenis konten Payload, masukkan MIME tipe untuk data payload Anda.

  4. (Opsional) Dalam kompilasi Model menggunakan bagian SageMaker Neo, untuk konfigurasi input Data, masukkan bentuk data dalam format kamus.

  5. Pilih Jalankan tugas.

Inference Recommender memulai pekerjaan, dan Anda dapat melihat pekerjaan dan hasilnya dari halaman daftar pemberi rekomendasi Inferensi di konsol. SageMaker

Jika Anda ingin menjalankan pekerjaan lanjutan dan melakukan uji beban khusus, atau jika Anda ingin mengonfigurasi pengaturan dan parameter tambahan untuk pekerjaan Anda, lihatJalankan uji beban khusus.