Daftarkan model - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Daftarkan model

Sebelum menambahkan kebijakan penskalaan ke model, pertama-tama Anda harus mendaftarkan model Anda untuk penskalaan otomatis dan menentukan batas penskalaan untuk model tersebut.

Prosedur berikut mencakup cara mendaftarkan model (varian produksi) untuk penskalaan otomatis menggunakan AWS Command Line Interface (AWS CLI) atau Application Auto Scaling API.

Daftarkan model (AWS CLI)

Untuk mendaftarkan varian produksi Anda, gunakan register-scalable-targetperintah dengan parameter berikut:

  • --service-namespace—Tetapkan nilai ini kesagemaker.

  • --resource-id—Pengidentifikasi sumber daya untuk model (khususnya, varian produksi). Untuk parameter ini, tipe sumber daya adalah endpoint dan pengidentifikasi unik adalah nama varian produksi. Misalnya, endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount.

  • --min-capacityJumlah minimum instans. Nilai ini harus diatur ke minimal 1 dan harus sama dengan atau kurang dari nilai yang ditentukan untukmax-capacity.

  • --max-capacity—Jumlah maksimum instance. Nilai ini harus diatur ke minimal 1 dan harus sama dengan atau lebih besar dari nilai yang ditentukan untukmin-capacity.

Contoh berikut menunjukkan cara mendaftarkan varian bernamamy-variant, berjalan pada my-endpoint titik akhir, yang dapat diskalakan secara dinamis untuk memiliki satu hingga delapan instance.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

Daftarkan model (Application Auto Scaling API)

Untuk mendaftarkan model Anda dengan Application Auto Scaling, gunakan aksi RegisterScalableTargetApplication Auto Scaling API dengan parameter berikut:

  • ServiceNamespace—Tetapkan nilai ini kesagemaker.

  • ResourceID—Pengidentifikasi sumber daya untuk varian produksi. Untuk parameter ini, tipe sumber daya adalah endpoint dan pengidentifikasi unik adalah nama varian. Sebagai contoh, endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension—Tetapkan nilai ini kesagemaker:variant:DesiredInstanceCount.

  • MinCapacityJumlah minimum instans. Nilai ini harus diatur ke minimal 1 dan harus sama dengan atau kurang dari nilai yang ditentukan untukMaxCapacity.

  • MaxCapacity—Jumlah maksimum instance. Nilai ini harus diatur ke minimal 1 dan harus sama dengan atau lebih besar dari nilai yang ditentukan untukMinCapacity.

Contoh berikut menunjukkan cara mendaftarkan varian bernamamy-variant, berjalan pada my-endpoint titik akhir, yang dapat diskalakan secara dinamis untuk menggunakan satu hingga delapan instance.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }