AWS Systems Manager 中的記錄和監控 - AWS Systems Manager

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS Systems Manager 中的記錄和監控

監控是維護 AWS Systems Manager 及您 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案各個部分收集監控資料,以便在發生多點失敗時,可更輕鬆地偵錯。AWS 提供多種工具,讓您監控 Systems Manager 和其他資源及回應潛在的事件。

AWS CloudTrail 日誌

CloudTrail 會提供由使用者、角色或 AWS 服務 在 Systems Manager 中採取之動作的記錄。您可以利用 CloudTrail 所收集的資訊來判斷向 Systems Manager 發出的請求,以及發出請求的 IP 地址、人員、時間和其他詳細資訊。如需更多詳細資訊,請參閱 使用記錄 AWS Systems Manager API 呼叫 AWS CloudTrail

Amazon CloudWatch 警示

使用 Amazon CloudWatch 警示,在一段時間內觀察您為 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體和其他資源指定的單一指標。如果指標超過指定的閾值,則會傳送一則通知至 Amazon Simple Notification Service (Amazon SNS) 主題或 AWS Auto Scaling 政策。CloudWatch 警示不會因為它們處於特定狀態而叫用動作。必須是狀態已變更並維持了所指定的時間長度,才會呼叫動作。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的使用 Amazon CloudWatch 警示

Amazon CloudWatch 儀表板

CloudWatch 儀表板是 CloudWatch 主控台中可自訂的首頁,可讓您在單一檢視中監控資源,甚至是分散在不同 AWS 區域 的那些資源。您可以使用 CloudWatch 儀表板來為 AWS 資源的指標和警示建立自訂檢視。如需更多詳細資訊,請參閱 Systems Manager 託管的 Amazon CloudWatch 儀表板

Amazon EventBridge

使用 Amazon EventBridge,您可以設定規則,提醒您 Systems Manager 資源中發生變更,並指示 EventBridge 根據事件的內容採取動作。EventBridge 提供了許多由各種 Systems Manager 功能發出的事件。如需更多詳細資訊,請參閱 使用 Amazon EventBridge 監控 Systems Manager

Amazon CloudWatch Logs 和 SSM Agent 日誌

SSM Agent 會在各個節點的日誌檔寫入有關執行、排定動作、錯誤和運作狀態的資訊。您可以手動連線到節點來檢視日誌檔案。建議自動將代理程式日誌資料傳送至 CloudWatch Logs 中的日誌群組以進行分析。如需詳細資訊,請參閱 傳送節點記錄至統一 CloudWatch 記錄檔 (CloudWatch 代理程式)檢視 SSM Agent 日誌

AWS Systems Manager 合規

您可以使用合規 (AWS Systems Manager 的功能) 來掃描您的受管節點機群,以檢查修補程式合規與組態的不一致。您可以從多個 AWS 帳戶 和 AWS 區域 收集並彙總資料,然後深入檢視不合規的特定資源。依預設,合規會顯示有關 Patch Manager (AWS Systems Manager 的功能) 修補和 State Manager (AWS Systems Manager 功能) 關聯的當前合規資料。如需更多詳細資訊,請參閱 AWS Systems Manager合規

AWS Systems Manager Explorer

Explorer (AWS Systems Manager 功能) 是可自訂的操作儀表板,可報告 AWS 資源的相關資訊。Explorer 會顯示您的 AWS 帳戶 和跨 AWS 區域 的操作資料 (OpsData) 的彙總檢視。在 Explorer 中,OpsData 包含有關 EC2 執行個體、修補程式合規詳細資料和操作工作項目 (OpsItems) 的中繼資料。Explorer 提供脈絡指出 OpsItems 如何分散於業務單位或應用程式、如何隨著時間而演變趨勢,以及如何隨類別而變化。您可以在 Explorer 中群組和篩選資訊,以專注於與您相關且需要採取動作的項目。如需更多詳細資訊,請參閱 AWS Systems Manager Explorer

AWS Systems Manager OpsCenter

OpsCenter (AWS Systems Manager 功能) 提供集中的位置,可讓操作工程師和 IT 專業人員檢視、調查和解決與 AWS 資源相關的操作工作項目 (OpsItems)。OpsCenter 會彙總各服務的 OpsItems 並進行標準化,同時提供每個 OpsItem、相關 OpsItems 及相關資源的情境調查資料。OpsCenter 也提供 Automation Runbook (AWS Systems Manager),可讓您用來快速解決問題。OpsCenter 與 Amazon EventBridge 整合。這表示您可以建立 EventBridge 規則,針對發佈事件至 EventBridge 的任何 AWS 服務 自動建立 OpsItems。如需更多詳細資訊,請參閱 AWS Systems Manager OpsCenter

Amazon Simple Notification Service

您可以將 Amazon Simple Notification Service (Amazon SNS) 設定為傳送通知,這些通知會與您使用 Run Command 或 Maintenance Windows (AWS Systems Manager 功能) 傳送的命令狀態相關。Amazon SNS 會協調和管理傳送和傳遞通知給已訂閱 Amazon SNS 主題的用戶端或端點。每當命令變更為新狀態或特定狀態時 (如「Failed」或「Timed Out」),您都會收到通知。當您將命令傳送至多個節點時,您都可以接收到傳送到特定節點之每個命令複本的通知。如需更多詳細資訊,請參閱 使用 Amazon SNS 通知監控 Systems Manager 狀態變更

AWS Trusted Advisor 和 AWS Health Dashboard

為成千上萬 AWS 客戶提供服務的過程中,學習到的最佳實務,都體現在 Trusted Advisor 中。Trusted Advisor 可檢查您的 AWS 環境,並在有可能節省成本、提升系統可用性與效能或填補安全漏洞時向您提出建議。所有 AWS 客戶都能存取五項 Trusted Advisor 檢查。AWS Support 商業或企業方案的客戶,可以檢視所有 Trusted Advisor 檢查。如需詳細資訊,請參閱 AWS Trusted AdvisorAWS Support 使用者指南AWS Health 使用者指南