本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控無伺服器端點
若要監控無伺服器端點,您可以使用 Amazon CloudWatch 警示。 CloudWatch 是從您的 AWS 應用程式和資源即時收集指標的服務。警示會在收集指標時監看指標,讓您能夠預先指定閾值和超出該閾值時要採取的動作。例如,如果您的端點違反了錯誤閾值,您的 CloudWatch 警報可以向您發送通知。通過設置 CloudWatch 警報,您可以查看端點的性能和功能。如需有關 CloudWatch 警示的詳細資訊,請參閱 Amazon 使用 CloudWatch 者指南中的使用 Amazon CloudWatch 警示。
使用監控 CloudWatch
以下指標是無伺服器端點的完整指標清單。以下未列出的任何指標都不會針對無伺服器端點發佈。如需下列指標的相關資訊,請參閱 SageMaker 使用 Amazon 監控 Amazon CloudWatch。
常見端點指標
這些 CloudWatch 指標與針對即時端點發佈的指標相同。
該OverheadLatency
指標會追蹤所有新 SageMaker 增的其他延遲,其中包括為無伺服器端點啟動新運算資源的冷啟動時間。與隨需無伺服器端點相比,透過佈建並行的無伺服器端點的 OverheadLatency
通常明顯較少。
無伺服器端點也可以使用Invocations4XXErrors
、Invocations5XXErrors
、Invocations
、ModelLatency
、ModelSetupTime
和 MemoryUtilization
指標。進一步了解指標,請參閱 SageMaker 端點叫用指標。
常見無伺服器端點指標
這些 CloudWatch 指標會透過佈建並行發佈,針對隨選無伺服器端點和無伺服器端點發佈。
指標名稱 | 描述 | 單位/統計資料 |
---|---|---|
ServerlessConcurrentExecutionsUtilization |
並行執行數量除以並行上限。 | 單位:無 有效的統計資料:平均、上限、下限 |
透過佈建並行的無伺服器端點指標
這些 CloudWatch 指標是針對具有佈建並行功能的無伺服器端點發佈。
指標名稱 | 描述 | 單位/統計資料 |
---|---|---|
ServerlessProvisionedConcurrencyExecutions |
端點所處理的並行執行數量。 | 單位:計數 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencyUtilization |
並行執行數量除以已配置的佈建並行。 | 單位:無 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencyInvocations |
由佈建並行處理的 InvokeEndpoint 請求數。 |
單位:計數 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencySpilloverInvocations |
由隨需無伺服器推論處理而未由佈建並行處理的 InvokeEndpoint 請求數。 |
單位:計數 有效的統計資料:平均、上限、下限 |
日誌
如果您想從端點監控日誌以進行偵錯或進度分析,可以使用 Amazon CloudWatch Logs。 SageMaker提供的記錄群組可用於無伺服器端點為。/aws/sagemaker/Endpoints/[EndpointName]
如需使用「 CloudWatch 登入」的詳細資訊 SageMaker,請參閱記錄 Amazon SageMaker 活動與 Amazon CloudWatch。若要進一步了解 CloudWatch 日誌,請參閱什麼是 Amazon CloudWatch 日誌? 在 Amazon CloudWatch 日誌用戶指南中。