本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
用於從無伺服器端點追蹤指標的警示和日誌
若要監控無伺服器端點,您可以使用 Amazon CloudWatch alarm. CloudWatch 是一種可從 AWS 應用程式和資源即時收集指標的服務。警示會在收集指標時監看指標,讓您能夠預先指定閾值和超出該閾值時要採取的動作。例如,如果您的端點違反錯誤閾值,您的 CloudWatch 警示可以傳送通知給您。透過設定 CloudWatch 警示,您可以掌握端點的效能和功能。如需 CloudWatch 警示的詳細資訊,請參閱 Amazon 使用者指南 中的使用 Amazon CloudWatch 警示。 CloudWatch
使用 監控 CloudWatch
以下指標是無伺服器端點的完整指標清單。以下未列出的任何指標都不會針對無伺服器端點發佈。如需下列指標的資訊,請參閱 SageMaker 使用 Amazon 監控 Amazon CloudWatch。
常見端點指標
這些 CloudWatch 指標與即時端點發佈的指標相同。
此OverheadLatency
指標會追蹤 SageMaker 新增的所有額外延遲,包括為您的無伺服器端點啟動新運算資源的冷啟動時間。與隨需無伺服器端點相比,透過佈建並行的無伺服器端點的 OverheadLatency
通常明顯較少。
無伺服器端點也可以使用Invocations4XXErrors
、Invocations5XXErrors
、Invocations
、ModelLatency
、ModelSetupTime
和 MemoryUtilization
指標。進一步了解指標,請參閱SageMaker 端點調用指標。
常見無伺服器端點指標
這些 CloudWatch 指標會針對隨需無伺服器端點和具有佈建並行的無伺服器端點發佈。
指標名稱 | 描述 | 單位/統計資料 |
---|---|---|
ServerlessConcurrentExecutionsUtilization |
並行執行數量除以並行上限。 | 單位:無 有效的統計資料:平均、上限、下限 |
透過佈建並行的無伺服器端點指標
這些 CloudWatch 指標會針對具有佈建並行的無伺服器端點發佈。
指標名稱 | 描述 | 單位/統計資料 |
---|---|---|
ServerlessProvisionedConcurrencyExecutions |
端點所處理的並行執行數量。 | 單位:計數 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencyUtilization |
並行執行數量除以已配置的佈建並行。 | 單位:無 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencyInvocations |
由佈建並行處理的 InvokeEndpoint 請求數。 |
單位:計數 有效的統計資料:平均、上限、下限 |
ServerlessProvisionedConcurrencySpilloverInvocations |
由隨需無伺服器推論處理而未由佈建並行處理的 InvokeEndpoint 請求數。 |
單位:計數 有效的統計資料:平均、上限、下限 |
日誌
如果您想要從端點監控日誌以進行偵錯或進度分析,您可以使用 Amazon CloudWatch Logs。您可以用於無伺服器端點的 SageMaker提供的日誌群組為 /aws/sagemaker/Endpoints/[EndpointName]
。如需在 中使用 CloudWatch 日誌的詳細資訊 SageMaker,請參閱 Amazon SageMaker 傳送至 Amazon CloudWatch Logs 的日誌群組和串流。若要進一步了解 CloudWatch Logs,請參閱 Amazon CloudWatch Logs 使用者指南 中的什麼是 Amazon Logs?。 CloudWatch