選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

用於從非同步端點追蹤指標的警示和日誌

焦點模式
用於從非同步端點追蹤指標的警示和日誌 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

您可以使用 Amazon CloudWatch 監控 SageMaker AI,它會收集原始資料並將其處理為可讀且近乎即時的指標。有了 Amazon CloudWatch,您可取得歷程資訊,更清楚掌握 Web 應用程式或服務的執行效能。如需 Amazon CloudWatch 的詳細資訊,請參閱 Amazon CloudWatch 是什麼?

使用 CloudWatch 進行監控

以下指標位於AWS/SageMaker命名空間,是非同步端點的完整指標清單。如果端點已啟用非同步推論,則不會發布下方未列出的任何計量資料。這類指標包括 (但不限於):

  • 額外負荷延遲

  • 調用

  • InvocationsPerInstance

常用端點指標

這些指標與目前針對即時端點發布的指標相同。如需 Amazon CloudWatch 中其他指標的詳細資訊,請參閱使用 Amazon CloudWatch 監控 SageMaker AI

指標名稱 描述 單位/統計資料

Invocation4XXErrors

請求的數量,模型傳回 4xx HTTP 回應代碼。對於每個 4xx 回應,將傳送 1,否則傳送 0。

單位:無

有效的統計資訊:平均、總和

Invocation5XXErrors

模型傳回 5xx HTTP 回應代碼之 InvokeEndpoint 請求的數量。對於每個 5xx 回應,將傳送 1,否則傳送 0。

單位:無

有效的統計資訊:平均、總和

ModelLatency

從 SageMaker AI 檢視時,模型回應所花費的時間間隔。這個間隔包含傳送請求和從模型容器擷取回應的本機通訊時間,以及在容器中完成推論的時間。

單位:微秒

有效的統計資訊:平均、總和、下限、上限與範例計數

非同步推論端點指標

啟用非同步推論的端點會發布這些指標。以下指標發布時包含 EndpointName 維度:

指標名稱 描述 單位/統計資料

ApproximateBacklogSize

目前正在處理或尚未處理之端點佇列中的項目數。

單位:計數

有效的統計資料:平均、上限、下限

ApproximateBacklogSizePerInstance

佇列中的項目數除以端點後面的執行個體數目。此指標主要用於為啟用異步的端點設定應用程式自動擴充。

單位:計數

有效的統計資料:平均、上限、下限

ApproximateAgeOfOldestRequest

佇列中最舊要求的年齡。

單位:秒

有效的統計資料:平均、上限、下限

HasBacklogWithoutCapacity

佇列中有要求,但端點後面沒有執行個體時,這個指標的值是 1。所有其他時間,這個值是 0。使用這個指標時,佇列一收到新請求,就會從零執行個體自動擴充端點。

單位:計數

有效的統計資訊:平均

以下指標發布時包含 EndpointNameVariantName 維度:

指標名稱 描述 單位/統計資料

RequestDownloadFailures

從 Amazon S3 下載請求時發生問題,因此發生推論失敗。

單位:計數

有效的統計資訊:總和

ResponseUploadFailures

將回應上傳到 Amazon S3 時有問題,因此推論失敗。

單位:計數

有效的統計資訊:總和

NotificationFailures

發生問題時發布通知。

單位:計數

有效的統計資訊:總和

RequestDownloadLatency

下載請求承載的總時間。

單位:微秒

有效的統計資訊:平均、總和、下限、上限與範例計數

ResponseUploadLatency

上傳回應承載的總時間。

單位:微秒

有效的統計資訊:平均、總和、下限、上限與範例計數

ExpiredRequests

佇列中因到達指定要求 TTL 而失敗的要求數目。

單位:計數

有效的統計資訊:總和

InvocationFailures

如果調用由於任何原因失敗。

單位:計數

有效的統計資訊:總和

InvocationsProcesssed

端點處理的非同步調用數目。

單位:計數

有效的統計資訊:總和

TimeInBacklog

要求處理前排入佇列的總時間。這不包括實際處理時間 (即下載時間』上傳時間』模型延遲)。

單位:毫秒

有效的統計資訊:平均、總和、下限、上限與範例計數

TotalProcessingTime

SageMaker AI 收到推論請求的時間,直到請求處理完成的時間。這包括排入待處理項目的時間,以及上傳和傳送回應通知 (如果有) 的時間。

單位:毫秒

有效的統計資訊:平均、總和、下限、上限與範例計數

Amazon SageMaker 非同步推論也包含主機層級指標。如需主機層級指標的資訊,請參閱 SageMaker AI 任務和端點指標

日誌

除了帳戶中發布到 Amazon CloudWatch 的模型容器日誌,您還可以取得用於追蹤和偵錯推論請求的新平台日誌。

新日誌以端點日誌群組的名義發布:

/aws/sagemaker/Endpoints/[EndpointName]

日誌串流名稱包含:

[production-variant-name]/[instance-id]/data-log.

日誌行包含請求的推論 ID,因此輕輕鬆鬆即可將錯誤對應到特定請求。

下一個主題:

檢查預測結果

上一個主題:

Delete
隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。