使用 Amazon 監控您的政策 CloudWatch - Amazon EBS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon 監控您的政策 CloudWatch

您可以使用來監控 Amazon Data Lifecycle Manager 生命週期政策 CloudWatch,這些政策會收集原始資料並將其處理為可讀且近乎即時的指標。您可以使用這些指標來確切地查看政策在一段時間內建立、刪除和複製了多少 Amazon EBS 快照和支援 EBS 的 AMI。您也可以設定留意特定閾值的警示,當滿足這些閾值時傳送通知或採取動作。

指標會保存 15 個月的時間,以便您存取歷史資訊,更清楚地了解生命週期政策在長時間內的執行效能。

有關 Amazon 的更多信息 CloudWatch,請參閱 Amazon CloudWatch 用戶指南

支援的指標

Data Lifecycle Manager 命名空間包含下列 Amazon Data Lifecycle Manager 生命週期政策的指標。支援的指標會因政策類型而有所不同。

所有指標都可以在 DLMPolicyId 維度上測量。最實用的統計資訊是 sumaverage,測量單位為 count

選擇索引標籤即可檢視該政策類型支援的指標。

EBS snapshot policies
指標 描述

ResourcesTargeted

快照或支援 EBS 的 AMI 政策中指定的標籤鎖定的目標資源數量。

SnapshotsCreateStarted

快照政策啟動的快照建立動作數量。每個動作只會記錄一次,即使後續有多次重試也是如此。

如果快照建立動作失敗,Amazon Data Lifecycle Manager 會傳送 SnapshotsCreateFailed 指標。

SnapshotsCreateCompleted

快照政策建立的快照數量。這包括排定時間 60 分鐘內的成功重試次數。

SnapshotsCreateFailed

快照政策無法建立的快照數量。這包括從排定時間起 60 分鐘內失敗的重試次數。

SnapshotsSharedCompleted

快照政策跨帳戶共用的快照數量。

SnapshotsDeleteCompleted

快照或支援 EBS 的 AMI 政策刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsDeleteFailed

快照或支援 EBS 的 AMI 政策無法刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsCopiedRegionStarted

快照政策啟動的跨區域快照複製動作數量。

SnapshotsCopiedRegionCompleted

快照政策建立的跨區域快照複本數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedRegionFailed

快照政策無法建立的跨區域快照複本數量。這包括從排定時間起 24 小時內失敗的重試次數。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

snapshotsArchiveDeletionFailed

快照政策無法從封存層刪除的封存快照數量。

snapshotsArchiveScheduled

快照政策排定封存的快照數量。

snapshotsArchiveCompleted

快照政策成功封存的快照數量。

snapshotsArchiveFailed

快照政策無法封存的快照數量。

snapshotsArchiveDeletionCompleted

快照政策成功從封存層刪除的封存快照數量。

PreScriptStarted

成功起始前置指令碼的執行個體數。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PreScriptCompleted

成功完成前置指令碼的執行個體數。即使前置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PreScriptFailed

無法成功完成前置指令碼的執行個體數。即使前置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptStarted

成功啟動後置指令碼的執行個體數。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptCompleted

成功完成後置指令碼的執行個體數。即使後置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

PostScriptFailed

無法成功完成後置指令碼的執行個體數。即使後置指令碼在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupStarted

成功起始 VSS 備份的執行個體數。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupCompleted

成功完成 VSS 備份的執行個體數。即使 VSS 備份在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

VSSBackupFailed

無法成功完成 VSS 備份的執行個體數。即使 VSS 備份在指定的逾時期間之外完成,也會發出指標。

如果啟用指令碼重試,每次政策執行時都可以多次發出此指標。

EBS-backed AMI policies

下列指標可與支援 EBS 的 AMI 政策搭配使用:

指標 描述

ResourcesTargeted

快照或支援 EBS 的 AMI 政策中指定的標籤鎖定的目標資源數量。

SnapshotsDeleteCompleted

快照或支援 EBS 的 AMI 政策刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsDeleteFailed

快照或支援 EBS 的 AMI 政策無法刪除的快照數量。此指標只適用於由政策建立的快照。其不適用於政策所建立的跨區域快照複本。

此指標包括支援 EBS 的 AMI 政策取消註冊 AMI 時所刪除的快照。

SnapshotsCopiedRegionDeleteCompleted

快照政策所刪除的跨區域快照複本數量 (如保留規則所指定)。

SnapshotsCopiedRegionDeleteFailed

快照政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

ImagesCreateStarted

EBS 支援 AMI 政策所啟CreateImage動的動作數目。

ImagesCreateCompleted

支援 EBS 的 AMI 政策建立的 AMI 數量。

ImagesCreateFailed

支援 EBS 的 AMI 政策無法建立的 AMI 數量。

ImagesDeregisterCompleted

支援 EBS 的 AMI 政策取消註冊的 AMI 數量。

ImagesDeregisterFailed

支援 EBS 的 AMI 政策無法取消註冊的 AMI 數量。

ImagesCopiedRegionStarted

支援 EBS 的 AMI 政策啟動的跨區域複製動作數量。

ImagesCopiedRegionCompleted

支援 EBS 的 AMI 政策建立的跨區域 AMI 複本數量。

ImagesCopiedRegionFailed

支援 EBS 的 AMI 政策無法建立的跨區域 AMI 複本數量。

ImagesCopiedRegionDeregisterCompleted

支援 EBS 的 AMI 政策取消註冊的跨區域 AMI 複本數量 (如保留規則所指定)。

ImagesCopiedRegionDeregisteredFailed

支援 EBS 的 AMI 政策無法取消註冊的跨區域 AMI 複本數量 (如保留規則所指定)。

EnableImageDeprecationCompleted

EBS 後端 AMI 政策標示為取代的 AMI 數量。

EnableImageDeprecationFailed

EBS 後端 AMI 政策不能標示為取代的 AMI 數量。

EnableCopiedImageDeprecationCompleted

EBS 後端 AMI 政策標示為取代的跨區域 AMI 複本數量。

EnableCopiedImageDeprecationFailed

EBS 後端 AMI 政策不能標示為取代的跨區域 AMI 複本數量。

Cross-account copy event policies

下列指標可以與跨帳戶複製事件政策搭配使用:

指標 描述

SnapshotsCopiedAccountStarted

跨帳戶複製事件政策啟動的跨帳戶快照複製動作數量。

SnapshotsCopiedAccountCompleted

跨帳戶複製事件政策從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內成功的重試次數。

SnapshotsCopiedAccountFailed

跨帳戶複製事件政策無法從另一個帳戶複製的快照數量。這包括排定時間的 24 小時內失敗的重試次數。

SnapshotsCopiedAccountDeleteCompleted

跨帳戶複製事件政策所刪除的跨區域快照複本數量 (由保留規則所指定)。

SnapshotsCopiedAccountDeleteFailed

跨帳戶複製事件政策無法刪除的跨區域快照複本數量 (如保留規則所指定)。

檢視政策的 CloudWatch 指標

您可以使用 AWS Management Console 或命令列工具列出 Amazon Data Lifecycle Manager 傳送給 Amazon 的指標 CloudWatch。

Amazon EC2 console
使用 Amazon EC2 主控台檢視指標
  1. 前往 https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Lifecycle Manager (生命週期管理器)。

  3. 在網格中選取政策,然後選取 Monitoring (監控) 索引標籤。

CloudWatch console
若要使用 Amazon CloudWatch 主控台檢視指標
  1. 請在以下位置開啟 CloudWatch 主控台。 https://console.aws.amazon.com/cloudwatch/

  2. 在導覽窗格中,選擇 指標

  3. 選取 EBS 命名空間,然後選取 Data Lifecycle Manager metrics (Data Lifecycle Manager 指標)。

AWS CLI
列出 Amazon Data Lifecycle Manager 的所有可用指標

使用 list-metrics 命令。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS
列出特定政策的所有指標

使用 list-metrics 命令並指定 DLMPolicyId 維度。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --dimensions Name=DLMPolicyId,Value=policy-abcdef01234567890
列出所有政策的單一指標

使用 list-metrics 命令並指定 --metric-name 選項。

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --metric-name SnapshotsCreateCompleted

政策的圖形指標

建立政策後,您可開啟 Amazon EC2 主控台,在 Monitoring (監控) 索引標籤檢視政策的監控圖表。每個圖表都以一個可用的 Amazon EC2 指標為基礎。

下列圖表指標可供使用:

  • 目標資源 (基於 ResourcesTargeted)

  • 快照建立已開始 (基於 SnapshotsCreateStarted)

  • 快照建立已完成 (基於 SnapshotsCreateCompleted)

  • 快照建立失敗 (基於 SnapshotsCreateFailed)

  • 快照共用已完成 (基於 SnapshotsSharedCompleted)

  • 快照刪除已完成 (基於 SnapshotsDeleteCompleted)

  • 快照刪除失敗 (基於 SnapshotsDeleteFailed)

  • 快照跨區域複製已開始 (基於 SnapshotsCopiedRegionStarted)

  • 快照跨區域複製已完成 (基於 SnapshotsCopiedRegionCompleted)

  • 快照跨區域複製失敗 (基於 SnapshotsCopiedRegionFailed)

  • 快照跨區域複本刪除已完成 (基於 SnapshotsCopiedRegionDeleteCompleted)

  • 快照跨區域複本刪除失敗 (基於 SnapshotsCopiedRegionDeleteFailed)

  • 快照跨帳戶複製已開始 (基於 SnapshotsCopiedAccountStarted)

  • 快照跨帳戶複製已完成 (基於 SnapshotsCopiedAccountCompleted)

  • 快照跨帳戶複製失敗 (基於 SnapshotsCopiedAccountFailed)

  • 快照跨帳戶複本刪除已完成 (基於 SnapshotsCopiedAccountDeleteCompleted)

  • 快照跨帳戶複本刪除失敗 (基於 SnapshotsCopiedAccountDeleteFailed)

  • AMI 建立已開始 (基於 ImagesCreateStarted)

  • AMI 建立已完成 (基於 ImagesCreateCompleted)

  • AMI 建立失敗 (基於 ImagesCreateFailed)

  • AMI 取消註冊已完成 (基於 ImagesDeregisterCompleted)

  • AMI 取消註冊失敗 (基於 ImagesDeregisterFailed)

  • AMI 跨區域複製已開始 (基於 ImagesCopiedRegionStarted)

  • AMI 跨區域複製已完成 (基於 ImagesCopiedRegionCompleted)

  • AMI 跨區域複製失敗 (基於 ImagesCopiedRegionFailed)

  • AMI 跨區域複本取消註冊已完成 (基於 ImagesCopiedRegionDeregisterCompleted)

  • AMI 跨區域複本取消註冊失敗 (基於 ImagesCopiedRegionDeregisteredFailed)

  • AMI 啟用取代已完成 (基於 EnableImageDeprecationCompleted)

  • AMI 啟用取代失敗 (基於 EnableImageDeprecationFailed)

  • AMI 跨區域複本啟用取代已完成 (基於 EnableCopiedImageDeprecationCompleted)

  • AMI 跨區域複本啟用取代失敗 (基於 EnableCopiedImageDeprecationFailed)

建立原則的 CloudWatch 警示

您可以建立 CloudWatch 警示來監控原則的 CloudWatch 指標。 CloudWatch 當測量結果達到您指定的臨界值時,會自動傳送通知給您。您可以使用 CloudWatch 控制台創建 CloudWatch 警報。

如需使用主 CloudWatch 控台建立警示的詳細資訊,請參閱 Amazon 使用 CloudWatch 者指南中的以下主題。

範例使用案例

以下是使用案例的範例。

範例 1: ResourcesTargeted 量度

您可以使用 ResourcesTargeted 指標,來監控某個特定政策每次執行時鎖定的資源總數。這可讓您在目標資源數量低於或高於預期閾值時觸發警示。

例如,如果您希望每日政策建立不超過 50 個磁碟區的備份,您可以建立警示,當在 1 小時的期間內 ResourcesTargetedsum 大於 50 時傳送電子郵件通知。如此一來,您可以確保沒有快照會從錯誤標記的磁碟區中意外建立。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 2: SnapshotDeleteFailed 量度

您可以使用 SnapshotDeleteFailed 指標來監控是否有失敗,以根據政策的快照保留規則來刪除快照。

例如,如果您建立的政策應該每十二小時自動刪除快照,您可以建立警示,當在 1 小時的期間內 SnapshotDeletionFailedsum 大於 0 時通知工程團隊。這有助於調查不當的快照保留,並確保不必要的快照不會增加您的儲存成本。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

範例 3: SnapshotsCopiedRegionFailed 量度

使用 SnapshotsCopiedRegionFailed 指標,來識別政策無法將快照複製到其他區域的時間。

例如,如果政策每天都會複製跨區域的快照,您就可以建立警示,當在 1 小時的期間內 SnapshotCrossRegionCopyFailedsum 大於 0 時將 SMS 傳送給工程團隊。這對於確認政策是否已成功複製歷程中的後續快照相當實用。

您可以使用下列命令來建立警示:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

管理報告失敗動作的政策

如需有關當其中一個政策針對失敗動作量度報告意外非零值時該如何處理的詳細資訊,請參閱如果 Amazon Data Lifecycle Manager 報告 CloudWatch 指標中失敗的動作,該怎麼辦? AWS 知識中心文章。