用於從無伺服器端點追蹤指標的警示和日誌 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

用於從無伺服器端點追蹤指標的警示和日誌

若要監控無伺服器端點,您可以使用 Amazon CloudWatch alarm. CloudWatch 是一種可從 AWS 應用程式和資源即時收集指標的服務。警示會在收集指標時監看指標,讓您能夠預先指定閾值和超出該閾值時要採取的動作。例如,如果您的端點違反錯誤閾值,您的 CloudWatch 警示可以傳送通知給您。透過設定 CloudWatch 警示,您可以掌握端點的效能和功能。如需 CloudWatch 警示的詳細資訊,請參閱 Amazon 使用者指南 中的使用 Amazon CloudWatch 警示 CloudWatch

使用 監控 CloudWatch

以下指標是無伺服器端點的完整指標清單。以下未列出的任何指標都不會針對無伺服器端點發佈。如需下列指標的資訊,請參閱 SageMaker 使用 Amazon 監控 Amazon CloudWatch

常見端點指標

這些 CloudWatch 指標與即時端點發佈的指標相同。

OverheadLatency指標會追蹤 SageMaker 新增的所有額外延遲,包括為您的無伺服器端點啟動新運算資源的冷啟動時間。與隨需無伺服器端點相比,透過佈建並行的無伺服器端點的 OverheadLatency 通常明顯較少。

無伺服器端點也可以使用Invocations4XXErrorsInvocations5XXErrorsInvocationsModelLatencyModelSetupTimeMemoryUtilization 指標。進一步了解指標,請參閱SageMaker 端點調用指標

常見無伺服器端點指標

這些 CloudWatch 指標會針對隨需無伺服器端點和具有佈建並行的無伺服器端點發佈。

指標名稱 描述 單位/統計資料
ServerlessConcurrentExecutionsUtilization 並行執行數量除以並行上限。

單位:無

有效的統計資料:平均、上限、下限

透過佈建並行的無伺服器端點指標

這些 CloudWatch 指標會針對具有佈建並行的無伺服器端點發佈。

指標名稱 描述 單位/統計資料
ServerlessProvisionedConcurrencyExecutions 端點所處理的並行執行數量。

單位:計數

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencyUtilization 並行執行數量除以已配置的佈建並行。

單位:無

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencyInvocations 由佈建並行處理的 InvokeEndpoint 請求數。

單位:計數

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencySpilloverInvocations 由隨需無伺服器推論處理而未由佈建並行處理的 InvokeEndpoint 請求數。

單位:計數

有效的統計資料:平均、上限、下限

日誌

如果您想要從端點監控日誌以進行偵錯或進度分析,您可以使用 Amazon CloudWatch Logs。您可以用於無伺服器端點的 SageMaker提供的日誌群組為 /aws/sagemaker/Endpoints/[EndpointName]。如需在 中使用 CloudWatch 日誌的詳細資訊 SageMaker,請參閱 Amazon SageMaker 傳送至 Amazon CloudWatch Logs 的日誌群組和串流。若要進一步了解 CloudWatch Logs,請參閱 Amazon CloudWatch Logs 使用者指南 中的什麼是 Amazon Logs? CloudWatch