監控無伺服器端點 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控無伺服器端點

若要監控無伺服器端點,您可以使用 Amazon CloudWatch 警示。 CloudWatch 是從您的 AWS 應用程式和資源即時收集指標的服務。警示會在收集指標時監看指標,讓您能夠預先指定閾值和超出該閾值時要採取的動作。例如,如果您的端點違反了錯誤閾值,您的 CloudWatch 警報可以向您發送通知。通過設置 CloudWatch 警報,您可以查看端點的性能和功能。如需有關 CloudWatch 警示的詳細資訊,請參閱 Amazon 使用 CloudWatch 者指南中的使用 Amazon CloudWatch 警示

使用監控 CloudWatch

以下指標是無伺服器端點的完整指標清單。以下未列出的任何指標都不會針對無伺服器端點發佈。如需下列指標的相關資訊,請參閱 SageMaker 使用 Amazon 監控 Amazon CloudWatch

常見端點指標

這些 CloudWatch 指標與針對即時端點發佈的指標相同。

OverheadLatency指標會追蹤所有新 SageMaker 增的其他延遲,其中包括為無伺服器端點啟動新運算資源的冷啟動時間。與隨需無伺服器端點相比,透過佈建並行的無伺服器端點的 OverheadLatency 通常明顯較少。

無伺服器端點也可以使用Invocations4XXErrorsInvocations5XXErrorsInvocationsModelLatencyModelSetupTimeMemoryUtilization 指標。進一步了解指標,請參閱 SageMaker 端點叫用指標

常見無伺服器端點指標

這些 CloudWatch 指標會透過佈建並行發佈,針對隨選無伺服器端點和無伺服器端點發佈。

指標名稱 描述 單位/統計資料
ServerlessConcurrentExecutionsUtilization 並行執行數量除以並行上限。

單位:無

有效的統計資料:平均、上限、下限

透過佈建並行的無伺服器端點指標

這些 CloudWatch 指標是針對具有佈建並行功能的無伺服器端點發佈。

指標名稱 描述 單位/統計資料
ServerlessProvisionedConcurrencyExecutions 端點所處理的並行執行數量。

單位:計數

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencyUtilization 並行執行數量除以已配置的佈建並行。

單位:無

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencyInvocations 由佈建並行處理的 InvokeEndpoint 請求數。

單位:計數

有效的統計資料:平均、上限、下限

ServerlessProvisionedConcurrencySpilloverInvocations 由隨需無伺服器推論處理而未由佈建並行處理的 InvokeEndpoint 請求數。

單位:計數

有效的統計資料:平均、上限、下限

日誌

如果您想從端點監控日誌以進行偵錯或進度分析,可以使用 Amazon CloudWatch Logs。 SageMaker提供的記錄群組可用於無伺服器端點為。/aws/sagemaker/Endpoints/[EndpointName]如需使用「 CloudWatch 登入」的詳細資訊 SageMaker,請參閱記錄 Amazon SageMaker 活動與 Amazon CloudWatch。若要進一步了解 CloudWatch 日誌,請參閱什麼是 Amazon CloudWatch 日誌?Amazon CloudWatch 日誌用戶指南中。