本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
服務環境狀態定義
服務環境可以處於四個可能狀態之一,指出其目前操作狀態和處理 SageMaker Training 任務的準備程度。每個狀態代表服務環境生命週期中的特定階段,從初始建立到操作準備,再到最終刪除。下表說明每個狀態及其意義:
州 | 描述 |
---|---|
CREATING |
建立服務環境時的初始狀態。在此狀態期間, 會 AWS Batch 驗證組態參數,並建立與 SageMaker AI 服務的整合。服務環境無法處理任務,與其相關聯的任何任務佇列都不會接受服務任務提交。對於正確設定的服務環境,建立程序通常會在幾秒鐘內完成。 |
VALID |
表示服務環境已通過所有組態驗證檢查並準備好處理 SageMaker 訓練任務的操作狀態。此狀態表示服務環境組態正確、具備所有必要許可, AWS Batch 並可代表您成功將任務提交至 SageMaker AI。服務環境會在此狀態下花費大部分的操作生命週期。 |
INVALID |
狀態表示服務環境遇到組態或許可問題,導致無法處理 SageMaker Training 任務。在解決基礎問題之前,與無效服務環境相關聯的任務佇列無法處理新的服務任務提交。 |
DELETING |
當您請求刪除服務環境時發生的狀態。在此狀態下, AWS Batch 會確保沒有任何作用中的 SageMaker 訓練任務與環境相關聯,並執行必要的清除操作。處於此狀態的服務環境無法處理新的任務提交,刪除程序會在所有相關資源正確清除後完成。 |
服務環境狀態轉換
服務環境狀態轉換會根據組態變更、驗證結果和操作運作狀態監控自動進行。 AWS Batch 服務會持續監控服務環境的運作狀態,並相應地更新狀態。了解這些轉換可協助您預測組態變更何時生效,以及如何解決導致無效狀態的問題。
成功建立和驗證後,服務環境會從 轉換為 CREATING
VALID
。此轉換會確認所有組態參數皆正確、已正確設定必要的 IAM 許可,而且服務環境可以成功與 SageMaker AI 服務整合。一旦進入 VALID
狀態,相關聯的任務佇列就可以開始處理服務任務提交。
INVALID
當組態驗證失敗或相依性無法使用時,服務環境會從 VALID
轉換為 。這可能是由於 IAM 角色修改、違反配額的容量限制變更,或影響服務環境運作能力的外部資源修改。狀態原因欄位提供有關導致無效狀態之原因的特定詳細資訊。
解決基礎問題VALID
INVALID
後,服務環境可以從 轉換回 。這可能包括更新 IAM 許可、更正容量組態,或還原對所需 AWS 資源的存取。轉換通常會在 AWS Batch 偵測到已解決組態問題時自動發生。