本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
您可以使用 Amazon CloudWatch 來監控 Amazon ECS 資源,前者會收集來自 Amazon ECS 的原始資料,並處理為可讀且近乎即時的指標。這些統計資料記錄會保留兩週,讓您可存取歷史資訊,且能更清楚叢集或服務的執行方式。Amazon ECS 指標資料會自動以 1 分鐘的期間傳送到 CloudWatch。如需有關 CloudWatch 的詳細資訊,請參閱 Amazon CloudWatch 使用者指南。
Amazon ECS 為叢集和服務提供免費指標。您可以為叢集開啟 Amazon ECS CloudWatch Container Insights 以取得每個任務的指標,包括 CPU、記憶體和 EBS 檔案系統使用率,但需額外付費。如需更多 Container Insights 的相關資訊,請參閱 使用具有增強可觀測性的 Container Insights 監控 Amazon ECS 容器。
考量事項
使用 Amazon ECS CloudWatch 指標時,應考慮下列事項。
-
Fargate 上託管的任何 Amazon ECS 服務都會自動擁有 CloudWatch CPU 和記憶體使用率指標,因此您不需要採取任何手動步驟。
-
對於 Amazon EC2 執行個體上託管的任何 Amazon ECS 任務或服務,Amazon EC2 執行個體需要版本
1.4.0
或更新版本 (Linux)1.0.0
或更新版本 (Windows) 的容器代理程式,才能產生 CloudWatch 指標。不過,我們建議您使用最新版的容器代理程式。如需檢查代理程式版本及更新至最新版本的資訊,請參閱「更新 Amazon ECS 容器代理程式」。 -
可靠 CloudWatch 指標的最低 Docker 版本是 Docker 版本
20.10.13
和更新版本。 -
您的 Amazon EC2 執行個體也需要您啟動 Amazon EC2 執行個體之 IAM 角色的
ecs:StartTelemetrySession
許可。如果您在 CloudWatch 指標可用於 Amazon ECS 之前建立 Amazon ECS 容器執行個體 IAM 角色,您可能需要新增此許可。如需容器執行個體 IAM 角色和連接容器執行個體之受管 IAM 政策的相關資訊,請參閱 Amazon ECS 容器執行個體 IAM 角色。 -
您可以在 Amazon ECS 容器代理程式組態中設定 ,在 Amazon EC2 執行個體上停用 CloudWatch 指標集合。
ECS_DISABLE_METRICS=true
如需詳細資訊,請參閱Amazon ECS 容器代理程式組態。
建議的指標
Amazon ECS 提供免費的 CloudWatch 指標,可讓您用來監控資源。CPU 和記憶體保留,以及整個叢集的 CPU、記憶體和 EBS 檔案系統使用率,以及叢集中服務的 CPU、記憶體和 EBS 檔案系統使用率,都可以使用這些指標進行測量。針對 GPU 工作負載,您可以量測叢集整體的 GPU 保留。
叢集中 Amazon ECS 任務託管的基礎設施會決定哪些指標可用。對於 Fargate 基礎設施上託管的任務,Amazon ECS 提供 CPU、記憶體和 EBS 檔案系統使用率指標,以協助監控您的服務。對於 EC2 執行個體上託管的任務,Amazon ECS 會在叢集和服務層級提供 CPU、記憶體和 GPU 保留指標,以及 CPU 和記憶體使用率指標。您需要監控單獨構成基礎設施的 Amazon EC2 執行個體。如需監控 Amazon EC2 執行個體的詳細資訊,請參閱《Amazon EC2 使用者指南》中的監控 Amazon EC2。
如需搭配 Amazon ECS 使用的建議警示相關資訊,請參閱《Amazon CloudWatch Logs 使用者指南》中的下列其中一項: