Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Dapatkan instans prospektif instan
Inference Recommender juga dapat memberi Anda daftar instance prospektif, atau jenis instans yang mungkin cocok untuk model Anda, di halaman detail model SageMaker AI Anda. Inference Recommender secara otomatis melakukan benchmarking awal terhadap model Anda agar Anda dapat memberikan lima contoh prospektif teratas. Karena ini adalah rekomendasi awal, kami sarankan Anda menjalankan pekerjaan rekomendasi contoh lebih lanjut untuk mendapatkan hasil yang lebih akurat.
Anda dapat melihat daftar instance prospektif untuk model Anda baik secara terprogram dengan menggunakan API, SageMaker Python SDK DescribeModel, atau konsol AI. SageMaker
catatan
Anda tidak akan mendapatkan instance prospektif untuk model yang Anda buat di SageMaker AI sebelum fitur ini tersedia.
Untuk melihat instance prospektif model Anda melalui konsol, lakukan hal berikut:
-
Pergi ke SageMaker konsol di https://console.aws.amazon.com/sagemaker/
. -
Di panel navigasi kiri, pilih Inferensi, lalu pilih Model.
-
Dari daftar model, pilih model Anda.
Pada halaman detail untuk model Anda, buka bagian Instans prospektif untuk menyebarkan model. Screenshot berikut menunjukkan bagian ini.
![Screenshot dari daftar instance prospektif pada halaman detail model.](images/inf-rec-prospective.png)
Di bagian ini, Anda dapat melihat instans prospektif yang dioptimalkan untuk biaya, throughput, dan latensi untuk penerapan model, bersama dengan informasi tambahan untuk setiap jenis instans seperti ukuran memori, jumlah CPU dan GPU, dan biaya per jam.
Jika Anda memutuskan ingin membandingkan muatan sampel dan menjalankan pekerjaan rekomendasi inferensi penuh untuk model Anda, Anda dapat memulai pekerjaan rekomendasi inferensi default dari halaman ini. Untuk memulai pekerjaan default melalui konsol, lakukan hal berikut:
-
Pada halaman detail model Anda di bagian Prospective instance to deploy model, pilih Run Inference recommended job.
-
Di kotak dialog yang muncul, untuk bucket S3 untuk benchmarking payload, masukkan lokasi Amazon S3 tempat Anda menyimpan muatan sampel untuk model Anda.
-
Untuk jenis konten Payload, masukkan tipe MIME untuk data payload Anda.
-
(Opsional) Dalam kompilasi Model menggunakan bagian SageMaker Neo, untuk konfigurasi input Data, masukkan bentuk data dalam format kamus.
-
Pilih Jalankan tugas.
Inference Recommender memulai pekerjaan, dan Anda dapat melihat pekerjaan dan hasilnya dari halaman daftar pemberi rekomendasi Inferensi di konsol AI. SageMaker
Jika Anda ingin menjalankan pekerjaan lanjutan dan melakukan uji beban khusus, atau jika Anda ingin mengonfigurasi pengaturan dan parameter tambahan untuk pekerjaan Anda, lihatJalankan uji beban khusus.