本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS 提供各種可用來監控 Amazon ECS 的工具。您可以設定其中一些工具來進行監控,但有些工具需要手動介入。建議您盡可能自動化監控任務。
自動化監控工具
您可以使用下列自動化監控工具來監看 Amazon ECS,並在發生錯誤時進行回報:
-
Amazon CloudWatch 警示:監看指定時段內的單一指標,並根據與多個時段內給定之閾值相對的指標值來執行一或多個動作。此動作是傳送到 Amazon Simple Notification Service (Amazon SNS) 主題或 Amazon EC2 Auto Scaling 政策的通知。CloudWatch 警示不會只因處於特定狀態就叫用動作,狀態必須已變更並已維持一段指定的時間。如需詳細資訊,請參閱使用 CloudWatch 監控 Amazon ECS。
如果服務的任務是使用 Fargate 啟動類型,您可以使用 CloudWatch 警示,以根據 CloudWatch 指標 (例如 CPU 和記憶體使用率) 來擴展和縮減服務中的任務。如需詳細資訊,請參閱自動擴展 Amazon ECS 服務。
如果叢集的任務或服務是使用 EC2 啟動類型,您可以使用 CloudWatch 警示,以根據 CloudWatch 指標 (例如叢集記憶體保留) 來縮減和擴展容器執行個體。
對於利用 Amazon ECS 最佳化 Amazon Linux AMI 啟動的容器執行個體,您可以使用 CloudWatch Logs 在一個便利位置檢視容器執行個體的不同日誌。您必須在容器執行個體上安裝 CloudWatch 代理程式。如需詳細資訊,請參閱 Amazon CloudWatch 使用者指南中的使用命令列下載並設定 CloudWatch 代理程式。您還必須將
ECS-CloudWatchLogs
政策新增至ecsInstanceRole
角色。如需詳細資訊,請參閱監控容器執行個體許可。 -
Amazon CloudWatch Logs:透過在任務定義中指定
awslogs
日誌驅動程式,藉以監控、存放及存取您的 Amazon ECS 任務中容器的日誌檔案。如需詳細資訊,請參閱將 Amazon ECS 日誌傳送至 CloudWatch 。您也可以從 Amazon ECS 容器執行個體監控、存放及存取作業系統和 Amazon ECS 容器代理程式日誌檔案。這種存取日誌的方法可用於使用 EC2 啟動類型的容器。
-
Amazon CloudWatch Events:匹配事件並將它們路由至一或多個目標函式或串流以進行變更、擷取狀態資訊,以及採取修正動作。如需詳細資訊,請參閱本指南使用 EventBridge 自動化對 Amazon ECS 錯誤的回應中的 和 EventBridge 是 Amazon EventBridge 使用者指南中的 Amazon CloudWatch Events 的演變。 EventBridge
-
Container Insights – 從容器化應用程式和微服務收集、彙總和摘要指標和日誌。Container Insights 會使用內嵌指標格式將資料收集為效能日誌事件。這些效能日誌事件是使用結構化 JSON 結構描述的項目,允許大規模擷取和存放高基數資料。從這些資料中,CloudWatch 會在叢集、任務和服務層級建立彙總指標,做為 CloudWatch 指標。您可在 CloudWatch 自動儀表板取得 Container Insights 收集的指標,也可在 CloudWatch 主控台的指標區段進行檢視。
-
AWS CloudTrail 日誌監控 – 在帳戶之間共用日誌檔案、透過將日誌檔案傳送至 CloudWatch Logs 即時監控 CloudTrail 日誌檔案、在 Java 中寫入日誌處理應用程式,以及驗證您的日誌檔案在 CloudTrail 交付後並未變更。如需詳細資訊,請參閱本指南中的 使用 記錄 Amazon ECS API 呼叫 AWS CloudTrail,以及《AWS CloudTrail 使用者指南》中的使用 CloudTrail 記錄檔案。
-
執行期監控 – 偵測環境中 AWS 叢集和容器的威脅。執行期監控使用 GuardDuty 安全代理程式,可增加個別 Amazon ECS 工作負載的執行期可見性,例如檔案存取、程序執行和網路連線。
手動監控工具
監控 Amazon ECS 的另一個重要部分是手動監控 CloudWatch 警示未涵蓋的項目。CloudWatch Trusted Advisor和其他 AWS 主控台儀表板提供 AWS 環境狀態的at-a-glance。我們建議您也檢查您容器執行個體上的日誌檔,以及您任務中的容器。
-
Amazon ECS 主控台:
-
EC2 啟動類型的叢集指標
-
服務指標
-
服務運作狀態
-
服務部署事件
-
-
CloudWatch 首頁:
-
目前警示與狀態
-
警示與資源的圖表
-
服務運作狀態
此外,您可以使用 CloudWatch 執行下列動作:
-
建立自訂儀表板來監控您關心的服務。
-
用於疑難排解問題以及探索驅勢的圖形指標資料。
-
搜尋和瀏覽您的所有 AWS 資源指標。
-
建立與編輯要通知發生問題的警示。
-
-
容器運作狀態檢查 - 這些命令會在容器本機上執行,並驗證應用程式運作狀態和可用性。您可以在任務定義中為每個容器設定這些值。
-
AWS Trusted Advisor 可協助您監控 AWS 資源,以提高效能、可靠性、安全性和成本效益。所有使用者皆可使用四個 Trusted Advisor 檢查;具有商業或企業支援計劃的使用者可使用超過 50 個檢查。如需詳細資訊,請參閱AWS Trusted Advisor
。 Trusted Advisor 具有與 Amazon ECS 相關的這些檢查:
-
容錯能力,指出您在單一可用區域中有執行中的服務。
-
容錯能力,指出您尚未針對多個可用區域使用分散置放策略。
-
-
AWS Compute Optimizer 是一種 服務,可分析 AWS 資源的組態和使用率指標。這會報告您的資源是否已為最佳化,並產生最佳化建議,以降低成本並改善工作負載的效能。
如需詳細資訊,請參閱AWS Compute Optimizer Amazon ECS 的建議。