在 Amazon RDS 中監控指標的概觀 - Amazon Relational Database Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon RDS 中監控指標的概觀

監控是維護 Amazon RDS 及您 AWS 解決方案可靠性、可用性和效能的重要部分。為了更輕鬆地偵錯多點故障,建議您從 AWS 解決方案的所有部分收集監控資料。

監控計畫

開始監控 Amazon RDS,請先建立監控計劃。此計畫應該回答下列問題:

  • 監控目標是什麼?

  • 監控哪些資源?

  • 監控這些資源的頻率為何?

  • 將使用哪些監控工具?

  • 誰將執行監控任務?

  • 發生問題時應該通知誰?

效能基準

若要達到監控目標,您需要建立一個基準。若要這麼做,請在 Amazon RDS 環境中以不同的時間、不同的負載條件下測量效能。您可以監控如下所示的指標:

  • 網路輸送量

  • 用戶端連線

  • 用於讀取、寫入或中繼資料操作的 I/O

  • 資料庫執行個體的爆量點數餘額

建議您儲存 Amazon RDS 的歷史效能資料。使用儲存的資料,您可以比較當前的效能與過去的趨勢。您也可以區分正常與異常的效能模式,並設計技術來解決問題。

效能指導方針

一般來說,效能指標的可接受值依據您應用程式相對於基準所執行的內容而定。調查距離基準的一致或趨勢變異。下列指標通常是效能問題的來源:

  • 高 CPU 或 RAM 耗用量 – CPU 或 RAM 耗用量若符合應用程式的目標 (如輸送量或並行) 且預期的值較高時,這樣的消耗量值就可能是合理的。

  • 磁碟空間消耗量 – 如果使用的空間持續保持在等於或高於總磁碟空間的 85%,請調查磁碟空間消耗量。看看從執行個體刪除資料或將資料封存至不同的系統來釋出空間是否可行。

  • 網路流量 – 對於網路流量,請洽系統管理員,以了解您的網域網路和網際網路連線預期的輸送量。調查網路流量的傳輸量是否如預期一致地降低。

  • 資料庫連線 – 如果您看到大量使用者連線,同時執行個體效能下降且回應時間延長,請考慮限制資料庫連線。資料庫執行個體使用者連接的最佳數量,將因執行個體類別和要執行的操作複雜性而不同。若要判定資料庫連線的數目,方法是將資料庫執行個體與 User Connections 參數設為 0 (無限制) 以外之值的參數群組建立關聯。您可以使用現有的參數群組或建立新的參數群組。如需更多詳細資訊,請參閱 使用參數群組

  • IOPS 指標 – IOPS 指標的預期值視磁碟規格和伺服器組態而定,因此請使用您的基準來了解何謂典型。調查值是否與您的基準一致地不同。為獲得最佳 IOPS 效能,請確定您的一般工作集將放入記憶體中,以將讀取和寫入操作降到最低。

當效能落在您建立的基準之外時,您可能需要進行變更,以最佳化工作負載的資料庫可用性。例如,您可能需要變更資料庫執行個體的執行個體類別。或者,您可能需要變更用戶端可用的資料庫執行個體和讀取複本的數目。

監控工具

監控對於維護 Amazon RDS 及其他 AWS 解決方案的可靠性、可用性和效能至關重要。AWS 提供各種監控工具,可讓您監看 Amazon RDS、在發現錯誤時回報,並適時採取自動動作。

自動化監控工具

建議您盡可能自動化監控任務。

Amazon RDS 執行個體狀態和建議

您可以使用下列自動化工具來監看 Amazon RDS,並在發生錯誤時回報:

  • Amazon RDS 執行個體狀態 – 檢視執行個體目前狀態的詳細資訊,方法是使用 Amazon RDS 主控台、AWS CLI 或 RDS API。

  • Amazon RDS建議 — 回應針對資料庫資源提供的自動化建議,例如資料庫執行個體、僅供讀取複本,以及資料庫參數群組。如需詳細資訊,請參閱檢視和回應 Amazon RDS 建議

Amazon RDS Amazon 極光的亞指標

Amazon RDS Amazon 與 Amazon 整合以 CloudWatch 提供額外的監控功能

  • Amazon CloudWatch — 此服務可即時監控您的AWS資源和執行AWS的應用程式。您可以將以下 Amazon CloudWatch 功能與 Amazon RDS Amazon 搭配使用:

    • 亞馬遜 CloudWatch 指標Amazon RDS Amazon 會針對 CloudWatch 每個作用中資料庫自動將指標傳送到每分鐘。在中,您不會收到 Amazon RDS 指標的額外費用 CloudWatch。如需詳細資訊,請參閱 使用 Amazon CloudWatch 監控 Amazon RDS 指標

    • Amazon CloudWatch 警示 — 您可以在特定時間段內觀看單個 Amazon RDS 指標。然後,您可以根據相對於您所設定臨界值的指標值執行一或多個動作。如需詳細資訊,請參閱 使用 Amazon CloudWatch 監控 Amazon RDS 指標

Amazon RDS Performance Insights 和作業系統監控

您能夠使用下列自動化工具來監控 Amazon RDS 效能:

整合服務

以下 AWS 服務會與 Amazon RDS 整合:

  • Amazon EventBridge 是一種無伺服器事件匯流排服務,可讓您輕鬆地將應用程式與各種來源的資料連接起來。如需詳細資訊,請參閱監控 Amazon RDS 事件

  • Amazon CloudWatch 日誌可讓您從 Amazon RDS Amazon 執行個體和其他來源監控 CloudTrail、存放和存取日誌檔。如需詳細資訊,請參閱監控 Amazon RDS 日誌檔案

  • AWS CloudTrail 擷取您 AWS 帳戶 發出或代表發出的 API 呼叫和相關事件,並傳送日誌檔案至您指定的 Amazon S3 儲存貯體。如需詳細資訊,請參閱在 AWS CloudTrail 中監控 Amazon RDS API 呼叫

  • 資料庫活動串流Amazon RDS 功能,可在 Oracle 資料庫執行個體中提供活動串 near-real-time流。如需詳細資訊,請參閱使用資料庫活動串流來監控 Amazon RDS

手動監控工具

您需要手動監視 CloudWatch 警報未涵蓋的項目。Amazon RDS AWS Trusted Advisor 和其他AWS主控台儀表板可提供您AWS環境狀態的 at-a-glance 檢視。 CloudWatch建議您也檢查資料庫執行個體上的日誌檔。

  • 從 Amazon RDS 主控台中,您可以監控資源的下列項目:

    • 資料庫執行個體的連線數目

    • 資料庫執行個體的讀取和寫入操作數量

    • 資料庫執行個體目前正在使用的儲存體數量

    • 正在針對資料庫執行個體使用的記憶體和 CPU 數量

    • 進出資料庫執行個體的網路流量

  • 從 Trusted Advisor 儀表板中,您可以檢閱下列成本最佳化、安全性、容錯,以及效能提升檢查:

    • Amazon RDS 閒置資料庫執行個體

    • Amazon RDS 安全群組存取風險

    • Amazon RDS 備份

    • Amazon RDS 異地同步備份

    如需這些檢查的詳細資訊,請參閱 Trusted Advisor 最佳實務 (檢查)

  • CloudWatch 主頁顯示:

    • 目前警示與狀態

    • 警示與資源的圖表

    • 服務運作狀態

    此外,您可以使用執行 CloudWatch 以下操作:

    • 建立自訂儀表板以監控您注重的服務。

    • 用於疑難排解問題以及探索驅勢的圖形指標資料。

    • 搜尋與瀏覽您的所有 AWS 資源指標。

    • 建立與編輯要通知發生問題的警示。