Amazon SWF 指標 CloudWatch - Amazon Simple Workflow Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SWF 指標 CloudWatch

Amazon SWF 現在可提供指標 CloudWatch ,讓您用來追蹤工作流程和活動,並根據您選擇的閾值設定警示。您可以使用檢視量度 AWS Management Console。如需詳細資訊,請參閱 使用 CloudWatch 的 Amazon SWF 指標AWS Management Console

Amazon SWF 指標的報告單元

報告時間間隔的指標

某些 Amazon SWF 指標 CloudWatch 是時間間隔,一律以毫秒為單位。該 CloudWatch 單位被報告為Time。這些指標通常對應至您可以設定工作流程和活動逾時的工作流程執行階段,並且具有類似的名稱。

例如,DecisionTaskStartToCloseTime 指標會測量決策任務開始執行後至完成所耗費的時間,這與您可以為 DecisionTaskStartToCloseTimeout 值設定的期間相同。

如需所有這些工作流程執行階段的圖表,及了解每個階段在工作流程和活動生命週期發生的時間,請參閱「Amazon SWF 超時類型 」。

報告計數的指標

一些用於 CloudWatch 報告結果的 Amazon SWF 指標計算為計數。例如,WorkflowsCanceled 會將結果記錄為 1 或 0,指出是否取消工作流程。值為 0 並不代表該指標未報告,意思是該指標描述的條件並未發生。

CloudWatch 該報告Count中的某些 Amazon SWF 指標 CloudWatch 是每秒計數。例如ProvisionedRefillRate,報告為 Count in CloudWatch,代表每秒請求Count速率

對於計數指標,最小值和最大值將一律為零或一,但平均值會是介於零到一的值。

API 和決策事件指標

您可以在中監視 API 和決策事件, CloudWatch 以深入了解您的使用情況和容量。請參閱Amazon SWF 運作方式本節中的決策程序,以及 Amazon 簡單工作流程服務 API 參考中的決策主題。

您也可以監控這些限制,以便在接近 Amazon SWF 節流限制時發出警示。如需這些限制和其預設設定的描述,請參閱「Amazon SWF 節流配額」。這些限制旨在預防不正確的工作流程使用過多的系統資源。若要請求提高限制,請參閱「請求提高配額」。

最佳做法是,您應該在 API 或決策事件容量的 60% 左右設定 CloudWatch 警示。這可讓您在啟用 Amazon SWF 節流之前調整工作流程或要求提高服務限制。根據呼叫的高載性,您可以設定不同的警示,以便於達到服務限制時發出通知:

  • 如果您的流量會有遽增情形,請設定在 ProvisionedBucketSize 達到 60% 的限制時發出警示。

  • 如果您呼叫的速率相當穩定,則請為相關 API 和決策事件設定在 ProvisionedRefillRate 達到 60% 的限制時發出警示。

Amazon SWF 指標

以下是可用於 Amazon SWF 的指標:

指標

描述

DecisionTaskScheduleToStartTime

決策任務排程後,到由工作者挑選並開始該任務之間的時間間隔 (毫秒)。

CloudWatch 單位:Time

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Average, Minimum, Maximum

DecisionTaskStartToCloseTime

決策任務從開始到其關閉之間的時間間隔 (毫秒)。

CloudWatch 單位:Time

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Average, Minimum, Maximum

DecisionTasksCompleted

已完成的決策作業計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

PendingTasks

以 1 分鐘為間隔的待處理任務特定任務清單計數。

CloudWatch 單位:Count

維度:Domain, TaskListName

有效的統計資訊:Sum

StartedDecisionTasksTimedOutOnClose

已開始但於關閉時已逾時的決策作業計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowStartToCloseTime

工作流程從開始到其關閉之間的時間 (毫秒)。

CloudWatch 單位:Time

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Average, Minimum, Maximum

WorkflowsCanceled

已取消的工作流程的計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowsCompleted

已完成的工作流程的計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowsContinuedAsNew

繼續做為新工作流程的計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowsFailed

失敗工作流程的計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowsTerminated

已終止之工作流程的計數。

CloudWatch 單位:Count

維度:Cause, Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

WorkflowsTimedOut

因任何原因逾時的工作流程計數。

CloudWatch 單位:Count

維度:Domain, WorkflowTypeName, WorkflowTypeVersion

有效的統計資訊:Sum

ActivityTaskScheduleToCloseTime

活動自排程後到其關閉之間的時間間隔 (毫秒)。

CloudWatch 單位:Time

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Average, Minimum, Maximum

ActivityTaskScheduleToStartTime

活動作業建立排程的時間與其開始的時間之間的時間間隔 (毫秒)。

CloudWatch 單位:Time

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Average, Minimum, Maximum

ActivityTaskStartToCloseTime

活動任務從開始到其關閉之間的時間間隔 (毫秒)。

CloudWatch 單位:Time

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Average, Minimum, Maximum

ActivityTasksCanceled

已取消的活動作業的計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

ActivityTasksCompleted

已完成的活動作業的計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

ActivityTasksFailed

失敗的活動作業的計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

ScheduledActivityTasksTimedOutOnClose

已排程但於關閉時已逾時的活動作業計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

ScheduledActivityTasksTimedOutOnStart

已排程但於開始時已逾時的活動作業計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

StartedActivityTasksTimedOutOnClose

已開始但於關閉時已逾時的活動作業計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

StartedActivityTasksTimedOutOnHeartbeat

已開始但因為活動訊號逾時而逾時的活動作業計數。

CloudWatch 單位:Count

維度:Domain, ActivityTypeName, ActivityTypeVersion

有效的統計資訊:Sum

ThrottledEvents

已調節之請求的計數。

CloudWatch 單位:Count

維度:APIName, DecisionName, ThrottlingScope

有效的統計資訊:Sum

ProvisionedBucketSize

每秒的可用請求計數。

維度:APIName, DecisionName

有效的統計資訊:Minimum

ConsumedCapacity

每秒的請求計數。

CloudWatch 單位:Count

維度:APIName, DecisionName

有效的統計資訊:Sum

ConsumedLimit

已使用的一般限制數量。

維度:GeneralLimitType

ProvisionedRefillRate

每秒允許進入儲存貯體的請求計數。

維度:APIName, DecisionName

有效的統計資訊:Minimum

ProvisionedLimit

佈建給帳戶的一般限制數量。

維度:GeneralLimitType

維度

描述

Domain

將資料篩選至執行工作流程或活動的 Amazon SWF 網域。

ActivityTypeName

將資料篩選為活動類型的名稱。

ActivityTypeVersion

將資料篩選為活動類型的版本。

WorkflowTypeName

將資料篩選為此工作流程執行的工作流程類型名稱。

WorkflowTypeVersion

將資料篩選為此工作流程執行的工作流程類型版本。

APIName

將資料篩選為指定之 API 名稱的 API。

DecisionName

將資料篩選為所指定的決策名稱。

TaskListName

將資料篩選為所指定的任務清單名稱。

TaskListClassification

將資料篩選為工作清單的分類。決策任務清單的值為「D」,而活動任務清單則為「A」。

ThrottlingScope

將資料篩選至指定的節流範圍。超出帳戶層級配額時,值為「帳戶」,或超出工作流程層級配額時為「工作流程」。

Amazon SWF 非 ASCII 資源名稱和 CloudWatch維度

Amazon SWF 允許在資源名稱中使用非 ASCII 字符,例如 TaskList 和 DomainName。但是,量度的維 CloudWatch 度值只能包含可列印的 ASCII 字元。為確保 Amazon SWF 使用與CloudWatch 需求相容的維度值,會轉換不符合這些需求的 Amazon SWF 資源名稱,並附加如下的總和檢查碼:

  • 任何非 ASCII 字元都會被取代為。?

  • 如有必要,輸入字符串或轉換後的字符串將被截斷。這樣可以確保在附加校驗和時,新的字符串長度不會超過 CloudWatch最大值。

  • 由於任何非 ASCII 字元都會轉換為?,因此轉換前不同的某些 CloudWatch 量度維度值可能會在轉換後看起來相同。為了幫助區分它們,在資源名稱後面附加一個底線(_),後跟原始資源名稱的 SHA256 校驗和的前 16 個字符。

轉換範例:

  • test àpple將被轉換為 test ?pple_82cc5b8e3a771d12

  • àòà將會轉換為???_2fec5edbb2c05c22

  • 名 TaskList 稱àpplé和都âpplè將被轉換為?ppl?,並且將是相同的。附加總和檢查碼會傳回不同的值,?ppl?_f39a36df9d85a69d與。?ppl?_da3efb4f11dd0f7f

提示

您可以生成自己的 SHA256 校驗和。例如,若要使用指shasum令行工具:

echo -n "<the original resource name>" | shasum -a 256 | cut -c1-16