協助改善此頁面
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
若要提供此使用者指南,請選擇位於每個頁面右窗格中的 GitHub 上編輯此頁面連結。
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
您可以使用許多可用的監控或日誌記錄工具在 Amazon EKS 中觀察您的資料。您的 Amazon EKS 日誌資料可以串流到 AWS 服務或合作夥伴工具以進行資料分析。中有許多 服務可提供 AWS Management Console 資料,以針對 Amazon EKS 問題進行故障診斷。您也可以使用 AWS支援的開放原始碼解決方案來監控 Amazon EKS 基礎設施。
在 Amazon EKS 主控台的左側導覽窗格中選取叢集後,您可以選擇叢集的名稱,然後選擇可觀測性索引標籤,以檢視叢集運作狀態和詳細資訊。若要檢視有關部署到叢集的任何現有 Kubernetes 資源的詳細資訊,請參閱 在 中檢視 Kubernetes 資源 AWS Management Console。
監控是維護 Amazon EKS 和您的 AWS 解決方案可靠性、可用性和效能的重要部分。我們建議您從 AWS 解決方案的所有部分收集監控資料。這樣,如果出現多點故障,您可以更輕鬆地進行偵錯。開始監控 Amazon EKS 前,請確保您的監控計畫可以解決下列問題。
-
您的目標是什麼? 如果叢集大幅擴展,您是否需要即時通知?
-
需要觀察哪些資源?
-
您需要多長時間觀察這些資源? 貴公司是否希望快速應對風險?
-
您要使用哪些工具? 如果您已在啟動時執行 AWS Fargate,則可以使用內建日誌路由器。
-
您打算由誰執行監控任務?
-
當出現問題時,您希望向誰傳送通知?
在 Amazon EKS 上監控和記錄
Amazon EKS 提供用於監控和記錄的內建工具。對於支援的版本,可觀測性儀表板可讓您了解叢集的效能。它可協助您快速偵測、疑難排解和修復問題。除了監控功能之外,還包含根據控制平面稽核日誌的清單。Kubernetes 控制平面公開了許多指標,這些指標也可以在主控台外抓取。
控制平面日誌記錄工具記錄對叢集的所有 API 呼叫、稽核資訊 (擷取哪些使用者對叢集執行哪些操作),以及以角色為基礎的資訊。如需詳細資訊,請參閱 AWS 規範指南中的在 Amazon EKS 上記錄和監控。
Amazon EKS 控制平面記錄從 Amazon EKS 控制平面將稽核和診斷日誌直接提供至您帳戶中的 CloudWatch Logs。這些日誌可讓您輕鬆執行叢集並確保叢集的安全。您可以選取所需的確切日誌類型,且日誌將以日誌串流傳送至 CloudWatch 中各個 Amazon EKS 叢集的群組中。如需詳細資訊,請參閱將控制平面日誌傳送至 CloudWatch Logs。
注意
當您檢查 Amazon CloudWatch 中的 Amazon EKS 驗證器日誌時,會顯示包含類似下列範例文字的項目。
level=info msg="mapping IAM role" groups="[]" role="arn:aws: iam::111122223333:role/XXXXXXXXXXXXXXXXXX-NodeManagerRole-XXXXXXXX" username="eks:node-manager"
預期應包含此文字的項目。username
是 Amazon EKS 內部服務角色,可對受管節點群組和 Fargate 執行特定操作。
對於低層級、可自訂的日誌記錄,可以使用 Kubernetes 日誌記錄
Amazon EKS 已與 AWS CloudTrail 整合,CloudTrail 是一種服務,可提供 Amazon EKS AWS 中使用者、角色或服務所採取動作的記錄。CloudTrail 會將 Amazon EKS 的所有 API 呼叫擷取為事件。擷取的呼叫包括從 Amazon EKS 主控台執行的呼叫,以及對 Amazon EKS API 作業發出的程式碼呼叫。如需詳細資訊,請參閱將 API 呼叫記錄為 AWS CloudTrail 事件。
Kubernetes API 伺服器公開多個可用於監控和分析的指標。如需詳細資訊,請參閱使用 Prometheus 監控叢集指標。
若要為自訂 Amazon CloudWatch logs設定 Fluent Bit,請參閱《Amazon CloudWatch 使用者指南》中的設定 Fluent Bit。
Amazon EKS 監控和記錄工具
Amazon Web Services 提供各種工具讓您可用於監控 Amazon EKS。您可以設定某些工具來設定自動監控,但有些工具則需要手動呼叫。建議您在您的環境和現有工具集允許的範圍內自動執行監控任務。
下表說明各種監控工具選項。
區域 | 工具 | 描述 | 設定 |
---|---|---|---|
控制平台 |
對於支援的版本,可觀測性儀表板可讓您了解叢集的效能。它可協助您快速偵測、疑難排解和修復問題。 |
||
應用程式/控制平面 |
Prometheus 可用來監控應用程式和控制平面的指標和提醒。 |
||
應用程式 |
CloudWatch Container Insights 會從您的容器化應用程式和微型服務收集、彙總及總結指標和日誌。 |
||
應用程式 |
ADOT 可以收集並傳送相關指標、追蹤資料和中繼資料,以 AWS 監控服務或合作夥伴。可以透過 CloudWatch Container Insights 進行設定。 |
||
應用程式 |
Amazon DevOps Guru 會偵測節點層級的操作效能和可用性。 |
||
應用程式 |
AWS X-Ray 會接收您應用程式的追蹤資料。此追蹤資料包括傳入和傳出請求以及有關請求的中繼資料。對於 Amazon EKS,實作需要 OpenTelemetry 附加元件。 |
||
應用程式 |
CloudWatch 在支援的版本上免費提供一些基本的 Amazon EKS 指標。您可以使用 CloudWatch 可觀測性運算子來擴展此功能,以處理收集指標、日誌和追蹤資料。 |
下表說明各種記錄工具選項。
區域 | 工具 | 描述 | 設定 |
---|---|---|---|
控制平台 |
對於支援的版本,可觀測性儀表板會根據控制平面稽核日誌顯示清單。它也包含控制 Amazon CloudWatch 中平面日誌的連結。 |
||
應用程式 |
Amazon CloudWatch Container Insights 會從容器化應用程式和微服務收集、彙總和摘要指標和日誌。 |
||
控制平台 |
您可以將稽核和診斷日誌直接從 Amazon EKS 控制平面傳送至您帳戶中的 CloudWatch Logs。 |
||
控制平台 |
它記錄由使用者、角色或服務所進行的 API 呼叫。 |
||
AWS Fargate 執行個體的多個區域 |
對於 AWS Fargate 執行個體,日誌路由器會將日誌串流到 AWS 服務或合作夥伴工具。它AWS 用於 Fluent Bit |