本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用端點自動調整
除了手動調整為文件分類端點和實體辨識器端點佈建的推論單元數量,您可以使用 auto Scaling 自動設定端點佈建以符合您的容量需求。
有兩種方法可以使用 auto Scaling 來調整為端點佈建的推論單元數量:
您只能使用 AWS Command Line Interface (AWS CLI) 設定 auto 縮放比例。如需有關 auto 縮放的詳細資訊,請參閱什麼是 Application Auto Scaling 放?