RDS DevOps 大師的關鍵概念 - Amazon DevOps 大師

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

RDS DevOps 大師的關鍵概念

DevOpsGuru 在偵測到操作應用程式中的異常或有問題的行為時,會產生洞察力。洞察包含一或多個資源的異常情況。異常表示 DevOps Guru 檢測到的一個或多個意外或不尋常的相關指標。

洞察的嚴重性為。洞察嚴重性取決於建立洞察力的最嚴重異常情況。例如,如果洞察 AWS-ECS_ MemoryUtilization _and_ else 包含一個嚴重性低的異常,另一個具有高嚴重性的異常,則洞察的整體嚴重性很高。

如果 Amazon RDS 資料庫執行個體已開啟 Performance Insights,則 DevOps Guru for RDS 會針對這些執行個體的異常情況提供詳細的分析和建議。為了識別異常情況,RDS 的 DevOps Guru 開發了資料庫度量值的基準。 DevOps然後,Guru for RDS 會比較目前的測量結果值與歷史基準線。

主動式洞察

主動洞察可讓您在異常行為發生前了解該行為。它包含具有建議和相關指標的異常情況,可幫助您在問題變得更大的問題之前解決問題。

每個主動分析頁面都提供有關一個異常的詳細資料。

反應式洞察

反應式洞察會在發生異常行為時有效識別。它包含具有建議、相關指標和事件的異常情況,可協助您立即瞭解並解決問題。

因果異常

因果異常是反應式洞察中最高等級的異常。它會在 DevOps Guru 主控台的異常詳細資料頁面上顯示為主要量度數據庫負載(數據庫負載)是 RDS DevOps 大師的因果異常。例如,深入解析 AWS-ECS_ MemoryUtilization _and_其它可能有數個度量異常,其中一個是資源 AWS/RDS 的資料庫載入 (資料庫負載)

透過深入分析,多個 Amazon RDS 資料庫執行個體可能會發生異常的資料庫負載 (資料庫負載)。每個資料庫執行個體的異常嚴重性可能會有所不同。例如,一個資料庫執行個體的嚴重性可能很高,而其他資料庫執行個體的嚴重性則較低。主控台預設為嚴重性最高的異常狀況。

情境異常

情境異常資料庫負載內的研究結果,與反應式洞察相關。它會顯示在 DevOps Guru 主控台中異常詳細資料頁面的「相關量度」區段中。每個情境異常都描述了需要調查的特定 Amazon RDS 效能問題。例如,因果異常可以包括下列內容異常:

  • 超出 CPU 容量 — CPU 執行佇列或 CPU 使用率高於正常狀態。

  • 資料庫記憶體不足 — 處理序沒有足夠的記憶體。

  • 資料庫連線激增 — 資料庫連線數目高於正常值。

建議

每個見解都至少有一個建議的動作。下列範例是由 DevOps大師針對 RDS 產生的建議:

  • 調整 SQL ID 清單 _OF_ID 以減少 CPU 使用率,或升級執行個體類型以增加 CPU 容量。

  • 檢閱目前資料庫連線的相關尖峰。請考慮調整應用程式集區設定值,以避免頻繁動態配置新的資料庫連線。

  • 尋找執行過多記憶體作業的 SQL 陳述式,例如記憶體內排序或大型聯結。

  • 調查下列 SQL 識別碼的大量 I/O 使用量:清單 _OF_ ID。

  • 檢查是否有建立大量暫存資料的陳述式,例如執行大型排序或使用大型暫存資料表的陳述式。

  • 檢查應用程式以瞭解造成資料庫工作負載增加的原因。

  • 請考慮啟用 MySQL 效能結構描述。

  • 檢查長時間運行的事務,並以提交或回滾結束它們。

  • 設定 idle_in_transaction_session_timeout 參數,以結束任何處於「交易閒置」狀態超過指定時間的工作階段。