Pelacakan target - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pelacakan target

Dengan pelacakan target, Anda dapat menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas berdasarkan penggunaan. Jumlah unit inferensi secara otomatis menyesuaikan sehingga kapasitas yang digunakan berada dalam persentase target dari kapasitas yang disediakan. Anda dapat menggunakan pelacakan target untuk mengakomodasi lonjakan penggunaan sementara untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas. Untuk informasi lebih lanjut, lihat Kebijakan penskalaan pelacakan target untuk Application Auto Scaling.

catatan

Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).

Menyiapkan pelacakan target

Untuk menyiapkan pelacakan target untuk titik akhir, Anda menggunakan perintah AWS CLI untuk mendaftarkan target yang dapat diskalakan dan kemudian membuat kebijakan penskalaan. Target yang dapat diskalakan mendefinisikan unit inferensi sebagai sumber daya yang digunakan untuk menyesuaikan penyediaan titik akhir, dan kebijakan penskalaan mendefinisikan metrik yang mengontrol penskalaan otomatis kapasitas yang disediakan.

Untuk mengatur pelacakan target
  1. Daftarkan target yang dapat diskalakan. Contoh berikut mendaftarkan target yang dapat diskalakan untuk menyesuaikan penyediaan titik akhir dengan kapasitas minimum 1 unit inferensi dan kapasitas maksimum 2 unit inferensi.

    Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Untuk titik akhir pengenal entitas, gunakan perintah CLI berikutAWS:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Untuk memverifikasi pendaftaran target yang dapat diskalakan, gunakan perintah AWS CLI berikut:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Buat konfigurasi pelacakan target untuk kebijakan penskalaan dan simpan konfigurasi dalam file bernamaconfig.json. Berikut ini adalah contoh konfigurasi pelacakan target yang secara otomatis menyesuaikan jumlah unit inferensi sehingga kapasitas yang digunakan selalu 70% dari kapasitas yang disediakan.

    { "TargetValue": 70, "PredefinedMetricSpecification": { "PredefinedMetricType": "ComprehendInferenceUtilization" } }
  4. Buat kebijakan penskalaan. Contoh berikut membuat kebijakan penskalaan berdasarkan konfigurasi pelacakan target yang ditentukan dalam config.json file.

    Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Untuk titik akhir pengenal entitas, gunakan perintah CLI berikutAWS:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Menghapus pelacakan target

Untuk menghapus pelacakan target untuk titik akhir, Anda menggunakan perintah AWS CLI untuk menghapus kebijakan penskalaan dan kemudian membatalkan pendaftaran target yang dapat diskalakan.

Untuk menghapus pelacakan target
  1. Hapus kebijakan penskalaan. Contoh berikut menghapus kebijakan penskalaan tertentu.

    Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Untuk titik akhir pengenal entitas, gunakan perintah CLI berikutAWS:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Batalkan pendaftaran target yang dapat diskalakan. Contoh berikut membatalkan pendaftaran target terukur yang ditentukan.

    Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Untuk titik akhir pengenal entitas, gunakan perintah CLI berikutAWS:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits