監控 Amazon EC2 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 Amazon EC2

監控是維護 Amazon 彈性運算雲端 (Amazon EC2) 執行個體和 AWS 解決方案的可靠性、可用性和效能的重要組成部分。您應該從 AWS 解決方案中的所有部分收集監視資料,以便在發生多點故障時更輕鬆地對多點失敗進行除錯。不過,在您開始監控 Amazon EC2 之前,應該建立包含下列項目的監控計畫:

  • 監控目標是什麼?

  • 要監控哪些資源?

  • 監控這些資源的頻率為何?

  • 要使用哪些監控工具?

  • 誰將執行監控任務?

  • 發生問題時應該通知誰?

在您定義監控目標並建立監控計畫之後,下一步是建立您環境中的正常 Amazon EC2 效能基準。您應該在不同的時間及負載條件下測量 Amazon EC2 效能。當您監控 Amazon EC2 時,應該存放所收集的監控資料的歷史紀錄。您可以比較目前的 Amazon EC2 效能資料與歷史資料,協助您辨識正常效能模式和效能異常狀況,並規劃其處理方式。例如,您可以監控 EC2 執行個體的 CPU 使用率、磁碟 I/O 和網路使用率。若效能不符合您所建立的基準,您可能需要重新設定或將執行個體最佳化,以降低 CPU 使用率、改善磁碟 I/O、降低網路流量。

若要建立基準,您至少必須監控下列項目:

要監控的項目 Amazon EC2 指標 監控代理程式/記錄檔 CloudWatch

CPU 使用率

CPUUtilization

網路使用率

NetworkIn

NetworkOut

磁碟效能

DiskReadOps

DiskWriteOps

磁碟讀取/寫入

DiskReadBytes

DiskWriteBytes

記憶體使用率、磁碟置換使用率、磁碟空間使用率、分頁檔使用率、日誌收集

[Linux 和 Windows 伺服器執行個體] 使用 CloudWatch 代理程式從 Amazon EC2 執行個體和現場部署伺服器收集指標和日誌

[從 Windows 伺服器執行個體上的先前 CloudWatch 記錄代理程式移轉] 將 Windows 伺服器執行個體記錄收集移轉至 CloudWatch 代理