更新或刪除使用 auto 調整規模的端點 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

更新或刪除使用 auto 調整規模的端點

更新使用 auto 調整規模的端點

當您更新端點時,Application Auto Scaling 會檢查該端點上的任何模型是否為自動調整規模的目標。如果更新會變更屬於 auto 動調整比例目標的任何模型的例證類型,則更新將失敗。

在中 AWS Management Console,您會看到一則警告,指出您必須先從 auto 縮放取消註冊模型,然後才能更新模型。如果您嘗試透過呼叫 UpdateEndpointAPI 更新端點,呼叫會失敗。在更新端點之前,請刪除為其設定的任何擴展政策,然後呼叫「Ap DeregisterScalableTargetplication Auto Scaling API」動作,取消將變體註冊為可擴展目標。更新端點後,您可以將更新的變體註冊為可擴展目標並附加擴展政策。

有一種例外狀況。如果您變更設定為自動擴展的變體的模型,Amazon SageMaker auto Scaling 會允許進行更新。這是因為變更模型通常不會影響到足以變更縮放行為的效能。如果您確實更新了為 auto 縮放配置的變體的模型,請確保對模型的變更不會對效能和擴展行為產生重大影響。

更新已套用 auto 調整規模的 SageMaker 端點時,請完成以下步驟:

更新已套用 auto 調整比例的端點
  1. 通過調用DeregisterScalableTarget取消註冊端點為可擴展目標。

  2. 由於在更新作業進行時 (或者如果您在上一個步驟中關閉了 auto 調整資源調整功能),因此您可能需要採取額外的預防措施,在更新期間增加端點的執行個體數目。為此,請通過調用更新端點上託管的生產變體的實例計數UpdateEndpointWeightsAndCapacities

  3. DescribeEndpoint反复調用,直到響應EndpointStatus字段的值為止InService

  4. 調 DescribeEndpointConfig用以獲取當前端點配置的值。

  5. 通過調用創建新的端點配置 CreateEndpointConfig。對於要保留現有執行個體計數或權重的生產變體,請使用從呼叫到上一個步驟的回應相同 DescribeEndpointConfig的變體名稱。對於所有其他值,請使用您在上一個步驟 DescribeEndpointConfig中呼叫時獲得的值作為回應。

  6. 透過呼叫 UpdateEndpoint 來更新端點。將您在上一步中建立的端點組態指定為 EndpointConfig 欄位。如果要保留執行個體計數或加權等變體屬性,請將 RetainAllVariantProperties 參數值設定為 True。這會指定具有相同名稱的生產變體將使用最新版本 DesiredInstanceCount 進行更新,這是來自對 DescribeEndpoint 的呼叫所得的回應,而不管新 EndpointConfigInitialInstanceCount 欄位值為何。

  7. (可選)通過調用RegisterScalableTargetPutScalingPolicy重新激活 auto 縮放。

注意

只有在因下列變更而更新端點時,才需要進行步驟 1 和 7:

  • 變更已設定 auto 調整規模之生產變體的執行個體類型

  • 移除已設定 auto 調整規模的生產變體。

刪除設定為 auto 調整規模的端

如果您刪除端點,Application Auto Scaling 會檢查該端點上的任何模型是否為自動調整規模的目標。如果有的話,而且您有解除登錄模型的權限,Application Auto Scaling 會逕自解除這些作為可擴展目標的登錄,不會再另行通知您。如果您使用不提供DeregisterScalableTarget動作權限的自訂權限原則,則必須先要求存取此動作,才能刪除端點。

注意

身為 IAM 使用者,如果其他使用者在該端點上設定了變體的 auto 擴展,您可能沒有足夠的權限來刪除端點。