本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 CloudWatch 監控資料生命週期管理員政策
您可以使用 CloudWatch 監控 Amazon Data Lifecycle Manager 生命週期政策,CloudWatch 會收集原始資料並將該資料處理成可讀且近乎即時的指標。您可以使用這些指標來確切地查看政策在一段時間內建立、刪除和複製了多少 Amazon EBS 快照和支援 EBS 的 AMI。您也可以設定留意特定閾值的警示,當滿足這些閾值時傳送通知或採取動作。
指標會保存 15 個月的時間,以便您存取歷史資訊,更清楚地了解生命週期政策在長時間內的執行效能。
如需 Amazon CloudWatch 的詳細資訊,請參閱《Amazon CloudWatch 使用者指南》。
支援的指標
AWS/EBS
命名空間中包含下列 Amazon Data Lifecycle Manager 指標。指標因政策類型而異。
所有指標都可以在 DLMPolicyId
維度上測量。最實用的統計資訊是 sum
和 average
,測量單位為 count
。
選擇索引標籤即可檢視該政策類型支援的指標。
檢視政策的 CloudWatch 指標
您可以使用 AWS Management Console 或命令列工具來列出 Amazon Data Lifecycle Manager 傳送至 Amazon CloudWatch 的指標。
政策的圖形指標
建立政策後,您可開啟 Amazon EC2 主控台,在 Monitoring (監控) 索引標籤檢視政策的監控圖表。每個圖表都以一個可用的 Amazon EC2 指標為基礎。
下列圖表指標可供使用:
-
目標資源 (基於
ResourcesTargeted
) -
快照建立已開始 (基於
SnapshotsCreateStarted
) -
快照建立已完成 (基於
SnapshotsCreateCompleted
) -
快照建立失敗 (基於
SnapshotsCreateFailed
) -
快照共用已完成 (基於
SnapshotsSharedCompleted
) -
快照刪除已完成 (基於
SnapshotsDeleteCompleted
) -
快照刪除失敗 (基於
SnapshotsDeleteFailed
) -
快照跨區域複製已開始 (基於
SnapshotsCopiedRegionStarted
) -
快照跨區域複製已完成 (基於
SnapshotsCopiedRegionCompleted
) -
快照跨區域複製失敗 (基於
SnapshotsCopiedRegionFailed
) -
快照跨區域複本刪除已完成 (基於
SnapshotsCopiedRegionDeleteCompleted
) -
快照跨區域複本刪除失敗 (基於
SnapshotsCopiedRegionDeleteFailed
) -
快照跨帳戶複製已開始 (基於
SnapshotsCopiedAccountStarted
) -
快照跨帳戶複製已完成 (基於
SnapshotsCopiedAccountCompleted
) -
快照跨帳戶複製失敗 (基於
SnapshotsCopiedAccountFailed
) -
快照跨帳戶複本刪除已完成 (基於
SnapshotsCopiedAccountDeleteCompleted
) -
快照跨帳戶複本刪除失敗 (基於
SnapshotsCopiedAccountDeleteFailed
) -
AMI 建立已開始 (基於
ImagesCreateStarted
) -
AMI 建立已完成 (基於
ImagesCreateCompleted
) -
AMI 建立失敗 (基於
ImagesCreateFailed
) -
AMI 取消註冊已完成 (基於
ImagesDeregisterCompleted
) -
AMI 取消註冊失敗 (基於
ImagesDeregisterFailed
) -
AMI 跨區域複製已開始 (基於
ImagesCopiedRegionStarted
) -
AMI 跨區域複製已完成 (基於
ImagesCopiedRegionCompleted
) -
AMI 跨區域複製失敗 (基於
ImagesCopiedRegionFailed
) -
AMI 跨區域複本取消註冊已完成 (基於
ImagesCopiedRegionDeregisterCompleted
) -
AMI 跨區域複本取消註冊失敗 (基於
ImagesCopiedRegionDeregisteredFailed
) -
AMI 啟用取代已完成 (基於
EnableImageDeprecationCompleted
) -
AMI 啟用取代失敗 (基於
EnableImageDeprecationFailed
) -
AMI 跨區域複本啟用取代已完成 (基於
EnableCopiedImageDeprecationCompleted
) -
AMI 跨區域複本啟用取代失敗 (基於
EnableCopiedImageDeprecationFailed
)
為政策建立 CloudWatch 警示
您可以建立 CloudWatch 警示,以監控政策的 CloudWatch 指標。CloudWatch 會在指標達到您指定的閾值時,自動傳送通知給您。您可以使用 CloudWatch 主控台建立 CloudWatch 警示。
如需有關使用 CloudWatch 主控台建立警示的詳細資訊,請參閱 Amazon CloudWatch 使用者指南中的以下主題。
範例使用案例
以下是使用案例的範例。
範例 1:ResourcesTargeted 指標
您可以使用 ResourcesTargeted
指標,來監控某個特定政策每次執行時鎖定的資源總數。這可讓您在目標資源數量低於或高於預期閾值時觸發警示。
例如,如果您希望每日政策建立不超過 50
個磁碟區的備份,您可以建立警示,當在 1
小時的期間內 ResourcesTargeted
的 sum
大於 50
時傳送電子郵件通知。如此一來,您可以確保沒有快照會從錯誤標記的磁碟區中意外建立。
您可以使用下列命令來建立警示:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
範例 2:SnapshotDeleteFailed 指標
您可以使用 SnapshotDeleteFailed
指標來監控是否有失敗,以根據政策的快照保留規則來刪除快照。
例如,如果您建立的政策應該每十二小時自動刪除快照,您可以建立警示,當在 1
小時的期間內 SnapshotDeletionFailed
的 sum
大於 0
時通知工程團隊。這有助於調查不當的快照保留,並確保不必要的快照不會增加您的儲存成本。
您可以使用下列命令來建立警示:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
範例 3:SnapshotsCopiedRegionFailed 指標
使用 SnapshotsCopiedRegionFailed
指標,來識別政策無法將快照複製到其他區域的時間。
例如,如果政策每天都會複製跨區域的快照,您就可以建立警示,當在 1
小時的期間內 SnapshotCrossRegionCopyFailed
的 sum
大於 0
時將 SMS 傳送給工程團隊。這對於確認政策是否已成功複製歷程中的後續快照相當實用。
您可以使用下列命令來建立警示:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
管理報告失敗動作的政策
如需某個政策針對失敗的動作指標報告非預期的非零值時該怎麼做的詳細資訊,請參閱文章 Amazon Data Lifecycle Manager 在 CloudWatch 指標中報告失敗的動作時該怎麼辦?