本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控叢集效能並檢視日誌
您可以使用許多可用的監控或記錄工具,在 Amazon EKS 中觀察資料。您的 Amazon EKS 日誌資料可以串流到 AWS 服務或合作夥伴工具以進行資料分析。中有許多 服務可提供 AWS Management Console 資料,以針對 Amazon EKS 問題進行疑難排解。您也可以使用 AWS支援的開放原始碼解決方案來監控 Amazon EKS 基礎設施。
在 Amazon EKS 主控台的左側導覽窗格中選取叢集後,您可以選擇叢集的名稱,然後選擇可觀測性索引標籤,以檢視叢集運作狀態和詳細資訊。檢視任何現有 的詳細資訊 Kubernetes 部署至叢集的資源,請參閱 在 中檢視 Kubernetes 資源 AWS Management Console。
監控是維護 Amazon EKS 和 AWS 解決方案可靠性、可用性和效能的重要部分。建議您從 AWS 解決方案的所有部分收集監控資料。這樣,如果出現多點故障,您可以更輕鬆地進行偵錯。開始監控 Amazon EKS 之前,請確定您的監控計畫解決下列問題。
-
您的目標是什麼? 如果叢集大幅擴展,您是否需要即時通知?
-
需要觀察哪些資源?
-
您需要多長時間觀察這些資源? 貴公司是否希望快速應對風險?
-
您要使用哪些工具? 如果您已在啟動過程中執行 AWS Fargate,則可以使用內建日誌路由器。
-
您打算由誰執行監控任務?
-
當出現問題時,您希望向誰傳送通知?
在 Amazon EKS 上監控和記錄
Amazon EKS 提供用於監控和記錄的內建工具。對於支援的版本,可觀測性儀表板可讓您掌握叢集的效能。它可協助您快速偵測、疑難排解和修復問題。除了監控功能之外,它還包含基於控制平面稽核日誌的清單。Kubernetes 控制平面公開了許多指標,這些指標也可以在主控台外進行抓取。
控制平面記錄會記錄對叢集的所有 API 呼叫、稽核資訊,擷取使用者對叢集執行的動作,以及角色型資訊。如需詳細資訊,請參閱 AWS 規範指南中的在 Amazon EKS 上記錄和監控。
Amazon EKS 控制平面記錄會直接從您帳戶中的 Amazon EKS 控制平面提供稽核和診斷 CloudWatch 日誌。這些日誌可讓您輕鬆執行叢集並確保叢集的安全。您可以選取所需的確切日誌類型,並將日誌作為日誌串流傳送至每個 Amazon EKS 叢集 in CloudWatch 的群組。如需詳細資訊,請參閱將控制平面日誌傳送至 CloudWatch Logs。
注意
當您在 Amazon CloudWatch 中檢查 Amazon EKS 身分驗證器日誌時,會顯示包含類似下列範例文字的文字項目。
level=info msg="mapping IAM role" groups="[]" role="arn:aws: iam::111122223333:role/XXXXXXXXXXXXXXXXXX-NodeManagerRole-XXXXXXXX" username="eks:node-manager"
預期應包含此文字的項目。username
是 Amazon EKS 內部服務角色,可為受管節點群組和 Fargate 執行特定操作。
對於低層級、可自訂的日誌記錄,可以使用 Kubernetes 日誌記錄
Amazon EKS 與 AWS CloudTrail 整合,此服務提供使用者、角色或 Amazon EKS 中 AWS 服務所採取動作的記錄。 CloudTrail 會將 Amazon EKS 的所有 API 呼叫擷取為事件。擷取的呼叫包括從 Amazon EKS 主控台呼叫,以及對 Amazon EKS API操作的程式碼呼叫。如需詳細資訊,請參閱將 API 呼叫記錄為 AWS CloudTrail 事件。
所以此 Kubernetes API 伺服器公開了許多對監控和分析有用的指標。如需詳細資訊,請參閱使用 Prometheus 監控叢集指標。
若要設定 Fluent Bit 如需自訂 Amazon CloudWatch 日誌,請參閱 Amazon CloudWatch 使用者指南中的設定 Fluent Bit。
Amazon EKS 監控和記錄工具
Amazon Web Services 提供各種可用來監控 Amazon EKS 的工具。您可以設定某些工具來設定自動監控,但有些工具則需要手動呼叫。建議您在您的環境和現有工具集允許的範圍內自動執行監控任務。
下表說明各種監控工具選項。
區域 | 工具 | 描述 | 設定 |
---|---|---|---|
控制平台 |
對於支援的版本,可觀測性儀表板可讓您掌握叢集的效能。它可協助您快速偵測、疑難排解和修復問題。 |
||
應用程式/控制平面 |
Prometheus 可用於監控應用程式和控制平面的指標和警示。 |
||
應用程式 |
CloudWatch Container Insights 會從容器化應用程式和微服務收集、彙總和摘要指標和日誌。 |
||
應用程式 |
ADOT 可以收集並傳送相關指標、追蹤資料和中繼資料,以 AWS 監控服務或合作夥伴。可透過 CloudWatch Container Insights 設定。 |
||
應用程式 |
Amazon DevOps |
Amazon DevOps Guru 會偵測節點層級的操作效能和可用性。 |
|
應用程式 |
AWS X-Ray 會接收有關應用程式的追蹤資料。此追蹤資料包括傳入和傳出請求以及有關請求的中繼資料。對於 Amazon EKS,實作需要 OpenTelemetry 附加元件。 |
||
應用程式 |
CloudWatch 在支援的版本上免費提供一些基本的 Amazon EKS 指標。您可以使用 CloudWatch 可觀測性運算子來擴展此功能,以處理收集指標、日誌和追蹤資料。 |
下表說明各種記錄工具選項。
區域 | 工具 | 描述 | 設定 |
---|---|---|---|
控制平台 |
對於支援的版本,可觀測性儀表板會根據控制平面稽核日誌顯示清單。它也包含控制 Amazon CloudWatch 中平面日誌的連結。 |
||
應用程式 |
Amazon CloudWatch Container Insights 會從容器化應用程式和微服務收集、彙總和摘要指標和日誌。 |
||
控制平台 |
您可以將稽核和診斷日誌直接從 Amazon EKS 控制平面傳送至您帳戶中的 CloudWatch 日誌。 |
||
控制平台 |
它記錄使用者、角色或服務呼叫的 API。 |
||
AWS Fargate 執行個體的多個區域 |
對於 AWS Fargate 執行個體,日誌路由器會將日誌串流到 AWS 服務或合作夥伴工具。它AWS 用於 Fluent Bit |