自動和手動監控
AWS 提供您可用來監控 Amazon EC2 的多種工具。您可以設定其中一些工具來進行監控,但有些工具需要手動介入。
自動化監控工具
您可以使用下列自動化監控工具來監看 Amazon EC2,並在發生錯誤時向您回報:
-
系統狀態檢查 – 監控使用您執行個體所需的 AWS 系統,確保系統正常運作。這些檢查工具會偵測執行個體需要 AWS 介入修復的問題。系統狀態檢查失敗時,您可以選擇等待 AWS 修正問題,也可以自行解決問題 (例如停止並重新啟動,或終止並取代執行個體)。導致系統狀態檢查失敗的問題範例包括:
-
網路連線中斷
-
系統電力中斷
-
實體主機的軟體問題
-
實體主機上會影響網路連線的硬體問題
如需詳細資訊,請參閱 您的執行個體的狀態檢查。
-
-
Instance status checks (執行個體狀態檢查) – 監控個別執行個體的軟體和網路組態。這些檢查會偵測需要您介入修復的問題。一般來說,當執行個體狀態檢查失敗時,您需要自行處理問題 (例如重新啟動執行個體,或在作業系統中進行修改)。可能導致執行個體狀態檢查失敗的問題範例包括:
-
系統狀態檢查失敗
-
網路或啟動組態的設定不正確
-
記憶體用盡
-
檔案系統毀損
-
核心不相容
如需詳細資訊,請參閱 您的執行個體的狀態檢查。
-
-
Amazon CloudWatch alarms (Amazon CloudWatch 警示) – 監看指定時段內的單一指標,並根據與多個時段內給定之閾值相對的指標值來執行一或多個動作。此動作是傳送到 Amazon Simple Notification Service (Amazon SNS) 主題或 Amazon EC2 Auto Scaling 政策的通知。警示僅會針對持續狀態變更呼叫動作。CloudWatch 警示不會只因處於特定狀態就叫用動作,狀態必須已變更並已維持一段指定的時間。如需詳細資訊,請參閱 使用 CloudWatch 監控您的執行個體。
-
Amazon EventBridge – 自動化您的 AWS 服務,並自動回應系統事件。來自 AWS 服務的事件會以近乎即時的速度交付至 EventBridge,且您可以指定在事件符合您寫入的規則時所要自動執行的動作。如需詳細資訊,請參閱 什麼是 Amazon EventBridge?。
-
Amazon CloudWatch Logs – 監控、存放及存取來自 Amazon EC2 執行個體、AWS CloudTrail 或其他來源的日誌檔案。如需詳細資訊,請參閱 Amazon CloudWatch Logs 使用者指南。
-
CloudWatch 代理程式 – 會從 EC2 執行個體和內部部署伺服器上的主機和訪客收集記錄和系統層級度量。如需詳細資訊,請參閱 《Amazon CloudWatch 使用者指南》 中的使用 CloudWatch 代理程式從 Amazon EC2 執行個體和現場部署伺服器收集指標和日誌。
-
AWS Management Pack for Microsoft System Center Operations Manager – 連結 Amazon EC2 執行個體以及在其內執行的 Windows 或 Linux 作業系統。AWS Management Pack 是 Microsoft System Center Operations Manager 的延伸。套件會使用資料中心內指定的電腦 (稱為監看器節點) 和 Amazon Web Services API,以從遠端探索和收集 AWS 資源的資訊。如需詳細資訊,請參閱 AWS Management Pack for Microsoft System Center。
手動監控工具
監控 Amazon EC2 的另一個重要部分包含手動為監控指令碼、狀態檢查和 CloudWatch 警示未涵蓋的項目進行監控。Amazon EC2 和 CloudWatch 主控台儀表板可提供 Amazon EC2 環境狀態的快速瀏覽檢視。
-
Amazon EC2 儀表板會顯示:
-
依區域的服務運作狀態和已排程事件
-
執行個體狀態
-
狀態檢查
-
警示狀態
-
執行個體指標詳細資訊 (在導覽窗格中,選擇 Instances (執行個體),選取某個執行個體,然後選擇 Monitoring (監控) 標籤)
-
磁碟區指標詳細資訊 (在導覽窗格中,選擇 Volumes (磁碟區),選取某個磁碟區,然後選擇 Monitoring (監控) 標籤)
-
-
Amazon CloudWatch 儀表板會顯示:
-
目前警示與狀態
-
警示與資源的圖表
-
服務運作狀態
此外,您可以使用 CloudWatch 執行下列動作:
-
繪製 Amazon EC2 監控資料圖表,以便對問題進行故障診斷並探索趨勢
-
搜尋與瀏覽您所有的 AWS 資源指標
-
建立與編輯要通知發生問題的警示
-
查看警示和 AWS 資源的快速瀏覽概觀
-