在 ARC 中使用 Amazon CloudWatch 搭配整備檢查 - Amazon 應用程式復原控制器 (ARC)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 ARC 中使用 Amazon CloudWatch 搭配整備檢查

Amazon Application Recovery Controller (ARC) 會將資料點發佈至 Amazon CloudWatch,以進行準備度檢查。CloudWatch 可讓使用一組時間序列資料的形式來擷取這些資料點的相關統計資料,也就是指標。您可以將指標視為要監控的變數,且資料點是該變數在不同時間點的值。例如,您可以監控指定期間內透過 AWS 區域的流量。每個資料點都有關聯的時間戳記和可選的測量單位。

您可以使用指標來確認系統的運作符合預期。例如,若指標超過您認為能夠接受的範圍,您可以建立 CloudWatch 警示來監控指定的指標並執行動作 (例如傳送通知到電子郵件地址)。

如需更多資訊,請參閱 Amazon CloudWatch 使用者指南

ARC 指標

AWS/Route53RecoveryReadiness 命名空間包含下列指標。

指標 描述
ReadinessChecks

代表 ARC 處理的整備檢查數量。指標可以依其狀態進行維度,如下所示。

單位Count

報告條件:有非零值。

統計資料:唯一有用的統計資料是 Sum

維度
  • READY

  • NOT_READY

  • NOT_AUTHORIZED

  • UNKNOWN

Resources

代表 ARC 處理的資源數量,可由其資源識別符加以維度,如 API 所定義。

單位Count

報告條件:有非零值。

統計資料:唯一有用的統計資料是 Sum

維度
  • ResourceSetType:這些是資源類型,依 ARC 評估的每個指定類型的資源數量進行篩選

    例如:AWS::CloudWatch::Alarm

ARC 指標的統計資料

CloudWatch 會根據 ARC 發佈的指標資料點提供統計資料。統計資料是指定期間內指標資料的彙總。當您請求統計資料時,傳回的資料流是藉由指標名稱和維度做識別。維度是用來單獨辨識指標的名稱/值組。

以下是您可能會發現有用的指標/維度組合範例:

  • 檢視 ARC 評估的整備程度檢查數量。

  • 檢視 ARC 評估之指定資源集類型的資源總數。

在 ARC 中檢視 CloudWatch 指標

您可以使用 CloudWatch 主控台或 檢視 ARC 的 CloudWatch 指標 AWS CLI。在 主控台中,指標會顯示為監控圖表。

您必須檢視美國西部 (奧勒岡) 區域中 ARC 的 CloudWatch 指標,無論是在主控台或使用 時 AWS CLI。當您使用 時 AWS CLI,請包含下列參數,為您的命令指定美國西部 (奧勒岡) 區域:--region us-west-2

使用 CloudWatch 主控台檢視指標
  1. https://console.aws.amazon.com/cloudwatch/ 開啟 CloudWatch 主控台。

  2. 在導覽窗格中,選擇指標

  3. 選取 Route53RecoveryReadiness 命名空間。

  4. (選用) 若要檢視所有維度的指標,請在搜尋欄位中鍵入其名稱。

使用 檢視指標 AWS CLI

使用下列 list-metrics 命令來列出可用指標:

aws cloudwatch list-metrics --namespace AWS/Route53RecoveryReadiness --region us-west-2
使用 取得指標的統計資料 AWS CLI

使用下列 get-metric-statistics 命令來取得指定指標和維度的統計資料。請注意,CloudWatch 將把維度的各獨特組合視為個別指標。您無法使用未特別發佈的維度組合來擷取統計資料。您必須指定建立指標時所使用的相同維度。

下列範例列出 ARC 中帳戶每分鐘評估的總整備度檢查。

aws cloudwatch get-metric-statistics --namespace AWS/Route53RecoveryReadiness \ --metric-name ReadinessChecks \ --region us-west-2 \ --statistics Sum --period 60 \ --dimensions Name=State,Value=READY \ --start-time 2021-07-03T01:00:00Z --end-time 2021-07-03T01:20:00Z

以下是來自 命令的範例輸出:

{ "Label": "ReadinessChecks", "Datapoints": [ { "Timestamp": "2021-07-08T18:00:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:04:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:01:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:02:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:03:00Z", "Sum": 1.0, "Unit": "Count" } ] }