使用 Amazon CloudWatch 監控政策 - Amazon Elastic Compute Cloud

使用 Amazon CloudWatch 監控政策

您可以使用 CloudWatch 監控 Amazon Data Lifecycle Manager 生命週期政策,CloudWatch 會收集原始資料並將該資料處理成可讀且近乎即時的指標。您可以使用這些指標來確切地查看政策在一段時間內建立、刪除和複製了多少 Amazon EBS 快照和支援 EBS 的 AMI。您也可以設定留意特定閾值的警示,當滿足這些閾值時傳送通知或採取動作。

指標會保存 15 個月的時間,以便您存取歷史資訊,更清楚地了解生命週期政策在長時間內的執行效能。

如需 Amazon CloudWatch 的詳細資訊,請參閱《Amazon CloudWatch 使用者指南》。

支援的指標

Data Lifecycle Manager 命名空間包含下列 Amazon Data Lifecycle Manager 生命週期政策的指標。支援的指標會因政策類型而有所不同。

所有指標都可以在 DLMPolicyId 維度上測量。最實用的統計資訊是 sumaverage,測量單位為 count

選擇索引標籤即可檢視該政策類型支援的指標。

EBS snapshot policies
指標 描述

ResourcesTargeted

快照或支援 EBS 的 AMI 政策中指定的標籤鎖定的目標資源數量。

SnapshotsCreateStarted

快照政策啟動的快照建立動作數量。每個動作只會記錄一次,即使後續有多次重試也是如此。

如果快照建立動作失敗,Amazon Data Lifecycle Manager 會傳送 SnapshotsCreateFailed 指標。

SnapshotsCreateCompleted

快照政策建立的快照數量。這包括排定時間 60 分鐘內的成功重試次數。

SnapshotsCreateFailed

快照政策無法建立的快照數量。這包括從排定時間起 60 分鐘內失敗的重試次數。

SnapshotsSharedCompleted

快照政策跨帳戶共用的快照數量。

SnapshotsDeleteCompleted

快照或支援 EBS 的 AMI 政策刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsDeleteFailed

快照或支援 EBS 的 AMI 政策無法刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsCopiedRegionStarted

快照政策啟動的跨區域快照複製動作數量。

SnapshotsCopiedRegionCompleted

快照政策建立的跨區域快照複本數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedRegionFailed

快照政策無法建立的跨區域快照複本數量。這包括從排定時間起 24 小時內失敗的重試次數。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

EBS-backed AMI policies

下列指標可與支援 EBS 的 AMI 政策搭配使用:

指標 描述

ResourcesTargeted

快照或支援 EBS 的 AMI 政策中指定的標籤鎖定的目標資源數量。

SnapshotsDeleteCompleted

快照或支援 EBS 的 AMI 政策刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsDeleteFailed

快照或支援 EBS 的 AMI 政策無法刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

ImagesCreateStarted

支援 EBS 的 AMI 政策啟動的 CreateImage 動作數量。

ImagesCreateCompleted

支援 EBS 的 AMI 政策建立的 AMI 數量。

ImagesCreateFailed

支援 EBS 的 AMI 政策無法建立的 AMI 數量。

ImagesDeregisterCompleted

支援 EBS 的 AMI 政策取消註冊的 AMI 數量。

ImagesDeregisterFailed

支援 EBS 的 AMI 政策無法取消註冊的 AMI 數量。

ImagesCopiedRegionStarted

支援 EBS 的 AMI 政策啟動的跨區域複製動作數量。

ImagesCopiedRegionCompleted

支援 EBS 的 AMI 政策建立的跨區域 AMI 複本數量。

ImagesCopiedRegionFailed

支援 EBS 的 AMI 政策無法建立的跨區域 AMI 複本數量。

ImagesCopiedRegionDeregisterCompleted

支援 EBS 的 AMI 政策取消註冊的跨區域 AMI 複本數量 (如保留規則所指定)。

ImagesCopiedRegionDeregisteredFailed

支援 EBS 的 AMI 政策無法取消註冊的跨區域 AMI 複本數量 (如保留規則所指定)。

EnableImageDeprecationCompleted

EBS 後端 AMI 政策標示為取代的 AMI 數量。

EnableImageDeprecationFailed

EBS 後端 AMI 政策不能標示為取代的 AMI 數量。

EnableCopiedImageDeprecationCompleted

EBS 後端 AMI 政策標示為取代的跨區域 AMI 複本數量。

EnableCopiedImageDeprecationFailed

EBS 後端 AMI 政策不能標示為取代的跨區域 AMI 複本數量。

Cross-account copy event policies

下列指標可以與跨帳戶複製事件政策搭配使用:

指標 描述

SnapshotsCopiedAccountStarted

跨帳戶複製事件政策啟動的跨帳戶快照複製動作數量。

SnapshotsCopiedAccountCompleted

跨帳戶複製事件政策從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedAccountFailed

跨帳戶複製事件政策無法從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內失敗的重試次數。

SnapshotsCopiedAccountDeleteCompleted

跨帳戶複製事件政策所刪除的跨區域快照複本數量 (由保留規則所指定)。

SnapshotsCopiedAccountDeleteFailed

跨帳戶複製事件政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

檢視政策的 CloudWatch 指標

您可以使用 AWS Management Console 或命令列工具,來列出 Amazon Data Lifecycle Manager 傳送到 Amazon CloudWatch 的指標。

Amazon EC2 console

使用 Amazon EC2 主控台檢視指標

  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Lifecycle Manager (生命週期管理器)。

  3. 在網格中選取政策,然後選擇 Monitoring (監控) 索引標籤。

CloudWatch console

使用 Amazon CloudWatch 主控台檢視指標

  1. 透過 https://console.aws.amazon.com/cloudwatch/ 開啟 CloudWatch 主控台。

  2. 在導覽窗格中,選擇 Metrics (指標)。

  3. 選取 EBS 命名空間,然後選取 Data Lifecycle Manager metrics (Data Lifecycle Manager 指標)。

AWS CLI

列出 Amazon Data Lifecycle Manager 的所有可用指標

使用 list-metrics 命令。

C:\> aws cloudwatch list-metrics --namespace AWS/EBS

列出特定政策的所有指標

使用 list-metrics 命令並指定 DLMPolicyId 維度。

C:\> aws cloudwatch list-metrics --namespace AWS/EBS --dimensions Name=DLMPolicyId,Value=policy-abcdef01234567890

列出所有政策的單一指標

使用 list-metrics 命令並指定 --metric-name 選項。

C:\> aws cloudwatch list-metrics --namespace AWS/EBS --metric-name SnapshotsCreateCompleted

政策的圖形指標

建立政策後,您可開啟 Amazon EC2 主控台,在 Monitoring (監控) 索引標籤檢視政策的監控圖表。每個圖表都以一個可用的 Amazon EC2 指標為基礎。

下列圖表指標可供使用:

  • 目標資源 (基於 ResourcesTargeted)

  • 快照建立已開始 (基於 SnapshotsCreateStarted)

  • 快照建立已完成 (基於 SnapshotsCreateCompleted)

  • 快照建立失敗 (基於 SnapshotsCreateFailed)

  • 快照共用已完成 (基於 SnapshotsSharedCompleted)

  • 快照刪除已完成 (基於 SnapshotsDeleteCompleted)

  • 快照刪除失敗 (基於 SnapshotsDeleteFailed)

  • 快照跨區域複製已開始 (基於 SnapshotsCopiedRegionStarted)

  • 快照跨區域複製已完成 (基於 SnapshotsCopiedRegionCompleted)

  • 快照跨區域複製失敗 (基於 SnapshotsCopiedRegionFailed)

  • 快照跨區域複本刪除已完成 (基於 SnapshotsCopiedRegionDeleteCompleted)

  • 快照跨區域複本刪除失敗 (基於 SnapshotsCopiedRegionDeleteFailed)

  • 快照跨帳戶複製已開始 (基於 SnapshotsCopiedAccountStarted)

  • 快照跨帳戶複製已完成 (基於 SnapshotsCopiedAccountCompleted)

  • 快照跨帳戶複製失敗 (基於 SnapshotsCopiedAccountFailed)

  • 快照跨帳戶複本刪除已完成 (基於 SnapshotsCopiedAccountDeleteCompleted)

  • 快照跨帳戶複本刪除失敗 (基於 SnapshotsCopiedAccountDeleteFailed)

  • AMI 建立已開始 (基於 ImagesCreateStarted)

  • AMI 建立已完成 (基於 ImagesCreateCompleted)

  • AMI 建立失敗 (基於 ImagesCreateFailed)

  • AMI 取消註冊已完成 (基於 ImagesDeregisterCompleted)

  • AMI 取消註冊失敗 (基於 ImagesDeregisterFailed)

  • AMI 跨區域複製已開始 (基於 ImagesCopiedRegionStarted)

  • AMI 跨區域複製已完成 (基於 ImagesCopiedRegionCompleted)

  • AMI 跨區域複製失敗 (基於 ImagesCopiedRegionFailed)

  • AMI 跨區域複本取消註冊已完成 (基於 ImagesCopiedRegionDeregisterCompleted)

  • AMI 跨區域複本取消註冊失敗 (基於 ImagesCopiedRegionDeregisteredFailed)

  • AMI 啟用取代已完成 (基於 EnableImageDeprecationCompleted)

  • AMI 啟用取代失敗 (基於 EnableImageDeprecationFailed)

  • AMI 跨區域複本啟用取代已完成 (基於 EnableCopiedImageDeprecationCompleted)

  • AMI 跨區域複本啟用取代失敗 (基於 EnableCopiedImageDeprecationFailed)

為政策建立 CloudWatch 警示

您可以建立 CloudWatch 警示,以監控政策的 CloudWatch 指標。CloudWatch 會在指標達到您指定的閾值時,自動傳送通知給您。您可以使用 CloudWatch 主控台建立 CloudWatch 警示。

如需有關使用 CloudWatch 主控台建立警示的詳細資訊,請參閱 Amazon CloudWatch 使用者指南中的以下主題。

範例 使用案例

以下是使用案例的範例。

範例 1:ResourcesTargeted 指標

您可以使用 ResourcesTargeted 指標,來監控某個特定政策每次執行時鎖定的資源總數。這可讓您在目標資源數量低於或高於預期閾值時觸發警示。

例如,如果您希望每日政策建立不超過 50 個磁碟區的備份,您可以建立警示,當在 1 小時的期間內 ResourcesTargetedsum 大於 50 時傳送電子郵件通知。如此一來,您可以確保沒有快照會從錯誤標記的磁碟區中意外建立。

您可以使用下列命令來建立警示:

C:\> aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 2:SnapshotDeleteFailed 指標

您可以使用 SnapshotDeleteFailed 指標來監控是否有失敗,以根據政策的快照保留規則來刪除快照。

例如,如果您建立的政策應該每十二小時自動刪除快照,您可以建立警示,當在 1 小時的期間內 SnapshotDeletionFailedsum 大於 0 時通知工程團隊。這有助於調查不當的快照保留,並確保不必要的快照不會增加您的儲存成本。

您可以使用下列命令來建立警示:

C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 3:SnapshotsCopiedRegionFailed 指標

使用 SnapshotsCopiedRegionFailed 指標,來識別政策無法將快照複製到其他區域的時間。

例如,如果政策每天都會複製跨區域的快照,您就可以建立警示,當在 1 小時的期間內 SnapshotCrossRegionCopyFailedsum 大於 0 時將 SMS 傳送給工程團隊。這對於確認政策是否已成功複製歷程中的後續快照相當實用。

您可以使用下列命令來建立警示:

C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

管理報告失敗動作的政策

如需了解當其中一個政策報告失敗動作指標的意外非零值時該如何處理,請參閱 如果 Amazon Data Lifecycle Manager 在 CloudWatch 指標中報告失敗的動作,該怎麼辦? AWS 知識中心文章。