Amazon EKS 的監控工具 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EKS 的監控工具

本節討論三種 Amazon EKS 監控工具: AWS 監控服務、開放原始碼或專屬解決方案,以及專用工具。

AWS 服務

  • Amazon CloudWatch:全方位監控和記錄服務

    CloudWatch 構成 AWS 監控解決方案的骨幹,並為 Amazon EKS 環境提供廣泛的功能。它為精細容器和叢集指標提供 Container Insights,因此您可以監控效能、資源使用率和應用程式運作狀態。此服務在日誌彙總和分析方面表現卓越,並支援跨容器和節點的集中式記錄。CloudWatch 自然與 整合 AWS 服務。它提供自動化警示組態,並支援自訂指標和儀表板,這使得它成為 Amazon EKS 監控的必要工具。

  • AWS X-Ray:進階分散式追蹤平台

    X-Ray 透過提供複雜的分散式追蹤功能來提升可觀測性。其服務地圖視覺化提供應用程式架構和相依性的清晰洞見,詳細的請求追蹤有助於識別跨服務的效能瓶頸。X-Ray 可以透過複雜的微服務架構追蹤請求,這使得它對於故障診斷和最佳化非常寶貴,尤其是在跨越多個 的分散式系統中 AWS 服務。

  • AWS Distro for OpenTelemetry:統一可觀測性架構

    Distro for OpenTelemetry 提供統一的資料收集功能與跨平台支援,因此非常適合混合環境。此服務與其他 整合 AWS 服務,支援自訂檢測,並提供實作全方位監控解決方案的彈性,同時維持與業界標準的相容性。

  • Amazon Managed Grafana:企業級視覺化

    Amazon Managed Grafana 為資料視覺化和分析提供全受管服務。它提供與其他 AWS 服務內建安全功能的無縫整合,以及企業級可擴展性。服務可簡化儀表板的建立和管理,同時提供進階功能,例如跨帳戶資料來源存取和與 的整合 AWS IAM Identity Center。

  • Amazon Managed Service for Prometheus:高可用性、安全、受管監控

    Amazon Managed Service for Prometheus 是一種全受管、與 Prometheus 相容的監控服務。它提供自動化擴展、高可用性和安全指標擷取和查詢。此服務與 Amazon EKS 無縫整合,並消除管理 Prometheus 伺服器的操作開銷。

開放原始碼或專屬解決方案

上一節所述的 AWS 工具提供無縫整合和受管服務。本節中列出的開放原始碼工具透過提供彈性和廣泛的自訂選項 AWS 服務 來補充 。了解每個工具的功能和使用案例,可協助您設計最符合您特定需求的監控策略。

  • Prometheus:指標收集工具組

    Prometheus 是在 Kubernetes 環境中收集指標的開放原始碼解決方案。其時間序列資料庫和 PromQL 查詢語言可實現複雜的指標分析。平台的服務探索功能會自動適應動態 Kubernetes 環境,其警示管理系統可讓您隨時掌握重大問題。Prometheus 提供廣泛的整合選項,使其成為全面指標監控的多樣化選擇。

  • Grafana:進階視覺化引擎

    Grafana 透過其視覺化功能,將複雜的監控資料轉換為可行的洞察。平台會建立自訂儀表板,結合來自多個來源的資料,並提供基礎設施和應用程式指標的統一檢視。其支援各種資料來源和警示管理功能,可提供全方位的監控。Grafana 可協助您視覺化即時和歷史資料,以便識別趨勢並做出明智的決策。

  • Fluent Bit:統一記錄層

    此日誌記錄解決方案提供 Kubernetes 環境的日誌收集和管理。其原生 Kubernetes 整合可確保從容器和節點無縫收集日誌,且其對多個輸出目的地的支援可提供日誌儲存和分析的彈性。日誌剖析和篩選等進階功能可讓您根據特定需求處理和路由日誌。Fluent Bit 的輕量性質使其特別適合容器化環境。

  • Datadog:全堆疊可觀測性

    Datadog 提供具有原生 Kubernetes 支援的全方位監控功能。它提供基礎設施監控、應用程式效能監控 (APM)、日誌管理和即時分析。您可以使用平台的自動服務探索和廣泛的整合目錄進行 Amazon EKS 監控,以及其機器學習功能來偵測異常並預測潛在問題。

  • 新複本:應用程式效能監控

    New Relic 提供應用程式效能和基礎設施運作狀態的可見性。其 Kubernetes 整合提供詳細的容器洞見、分散式追蹤和自訂儀表板。平台可協助您將應用程式效能與基礎設施指標相互關聯,以便快速識別和解決問題。

  • Elastic Stack (ELK Stack):日誌分析和搜尋

    ELK Stack 結合了 Elasticsearch、Logstash 和 Kibana,以提供日誌管理和分析功能。它提供進階搜尋功能、視覺化工具和機器學習功能。您可以使用 堆疊來處理來自 Amazon EKS 環境的大量日誌資料。

專用工具

您可以根據您的特定監控需求、操作規模和組織偏好設定,混合和比對下列工具。關鍵是建立監控堆疊,提供全面的可見性,同時保持可管理且符合成本效益。

  • kube-state-metrics (KSM):Kubernetes 狀態監控

    此附加元件服務會接聽 Kubernetes API 伺服器,並產生物件狀態的指標。它提供部署、Pod 和其他 Kubernetes 資源運作狀態的洞見。

  • Kubernetes 指標伺服器:資源指標

    此指標伺服器會從 kubelet 收集資源指標,並透過 Kubernetes 指標 API 公開這些指標。它提供水平 Pod 自動擴展和基本 CPU 和記憶體指標。

  • Kubecost:Kubernetes 成本監控

    Kubecost 等工具為 EKS 叢集提供詳細的成本分析和最佳化建議。它們可協助您了解和最佳化不同命名空間、部署和服務之間的雲端支出。