本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Aurora Postgre 中監控本機寫入轉送SQL
您可以使用以下章節來監控 Aurora PostgreSQL 叢集中的本機寫入轉送,包括相關 CloudWatch 指標和等待事件,以追蹤效能並識別潛在問題。
用於寫入轉送的 Amazon CloudWatch 指標和 Aurora PostgreSQL 狀態變數
當您在一或多個僅供讀取複本上使用寫入轉送時,下列 Amazon CloudWatch 指標適用於寫入器資料庫執行個體。
CloudWatch 指標 | 單位和描述 |
---|---|
|
計數 (每秒) 此寫入器資料庫執行個體每秒處理的轉送DML陳述式數量。 |
|
計數。此寫入器資料庫執行個體處理轉送查詢的開啟工作階段數目。 |
|
計數。此寫入器資料庫執行個體上轉送的工作階段總數。 |
下列 CloudWatch 指標適用於每個僅供讀取複本。這些指標是在啟用本機寫入轉送的情況下,在資料庫叢集中的每個讀取器資料庫執行個體上測量。
CloudWatch 指標 | 單位和描述 |
---|---|
|
計數 (每秒) 此複本每秒轉送之工作階段中的遞交數目。 |
|
毫秒。在複本DMLs上轉送的平均回應時間,以毫秒為單位。 |
|
計數 (每秒) 每秒在此複本上處理的轉送DML陳述式數目。 |
|
計數。寫入器資料庫執行個體拒絕的工作階段數量,因為已達到最大連線數或最大寫入轉送連線數的限制。 |
|
計數。在複本執行個體上使用本機寫入轉送的工作階段數量。 |
|
毫秒。複本等待的平均等待時間,以毫秒為單位,與寫入器資料庫執行個體LSN的 一致。讀取器資料庫執行個體等待的程度取決於 apg_write_forward.consistency_mode 設定。如需有關此設定的詳細資訊,請參閱 Aurora PostgreSQL 中寫入轉送的組態參數。 |
Aurora Postgre 中本機寫入轉送的等待事件SQL
當您搭配 Aurora Postgre 使用寫入轉送時,Amazon Aurora 會產生下列等待事件SQL。
主題
IPC:AuroraWriteForwardConnect
當僅供讀取複本上的後端程序正在等待寫入器資料庫執行個體的連線開啟時,就會發生IPC:AuroraWriteForwardConnect
事件。
等待時間增加的可能原因
此事件會隨著從僅供讀取複本到寫入器節點的連線嘗試次數增加而增加。
動作
減少從僅供讀取複本到寫入器節點的同時連線數。
IPC:AuroraWriteForwardConsistencyPoint
IPC:AuroraWriteForwardConsistencyPoint
事件說明來自僅供讀取複本上節點的查詢,等待轉送寫入操作的結果複寫至目前區域的時間。只有在工作階段層級參數 apg_write_forward.consistency_mode
設定為下列其中一項時,才會產生此事件:
SESSION
– 僅供讀取複本上的查詢會等待該工作階段中所有變更的結果。GLOBAL
– 僅供讀取複本上的查詢會等待該工作階段所做的變更結果,以及寫入器資料庫執行個體和僅供讀取複本的所有遞交變更。
如需有關 apg_write_forward.consistency_mode
參數設定的資訊,請參閱 Aurora PostgreSQL 中寫入轉送的組態參數。
等待時間增加的可能原因
等待時間較長的常見原因如下:
以 Amazon CloudWatch
ReplicaLag
指標測量的複本延遲增加。如需此指標的詳細資訊,請參閱 監控 Aurora PostgreSQL 複寫。寫入器資料庫執行個體或僅供讀取複本的負載增加。
動作
請根據應用程式的需求變更一致性模式。
IPC:AuroraWriteForwardExecute
當僅供讀取複本上的後端程序正在等待轉送的查詢完成並從資料庫叢集的寫入器節點取得結果時,就會發生IPC:AuroraWriteForwardExecute
事件。
等待時間增加的可能原因
等待時間增加的常見原因包括:
從寫入器節點擷取大量資料列。
寫入器節點和僅供讀取複本之間的網路延遲增加,使得僅供讀取複本從寫入器節點接收資料的時間增加。
增加僅供讀取複本的負載可能會延遲查詢請求從僅供讀取複本傳輸到寫入器節點。
寫入器節點上增加的負載可能會延遲資料從寫入器節點傳輸到僅供讀取複本的時間。
動作
根據等待事件的原因,我們會建議不同的動作。
最佳化查詢以僅擷取必要的資料。
最佳化資料處理語言 (DML) 操作,僅修改必要的資料。
如果僅供讀取複本或寫入器節點受限於 CPU或 網路頻寬,請考慮將其變更為具有更多CPU容量或更多網路頻寬的執行個體類型。
IPC:AuroraWriteForwardGetGlobalConsistencyPoint
當使用GLOBAL一致性模式的僅供讀取複本上的後端程序正在等待從寫入器節點取得全域一致性點,然後執行查詢時,就會發生IPC:AuroraWriteForwardGetGlobalConsistencyPoint
事件。
等待時間增加的可能原因
等待時間增加的常見原因包括:
增加僅供讀取複本和寫入器節點之間的網路延遲,會增加讀取複本從寫入器節點接收資料所需的時間。
增加僅供讀取複本的負載可能會延遲查詢請求從僅供讀取複本傳輸到寫入器節點。
寫入器節點上增加的負載可能會延遲資料從寫入器節點傳輸到僅供讀取複本的時間。
動作
根據等待事件的原因,我們會建議不同的動作。
請根據應用程式的需求變更一致性模式。
如果僅供讀取複本或寫入器節點受限於 CPU或 網路頻寬,請考慮將其變更為具有更多CPU容量或更多網路頻寬的執行個體類型。
IPC:AuroraWriteForwardXactAbort
當僅供讀取複本上的後端程序正在等待遠端清除查詢的結果時,就會發生IPC:AuroraWriteForwardXactAbort
事件。在中止寫入轉送的交易之後,會發出清除查詢以將程序返回到適當的狀態。Amazon Aurora 執行這些操作可能是因為發現錯誤,也可能是因為使用者發出了明確的 ABORT
命令或取消了正在執行的查詢。
等待時間增加的可能原因
等待時間增加的常見原因包括:
增加僅供讀取複本和寫入器節點之間的網路延遲,會增加讀取複本從寫入器節點接收資料所需的時間。
增加僅供讀取複本的負載可能會延遲從僅供讀取複本到寫入器節點的清除查詢請求傳輸。
寫入器節點上增加的負載可能會延遲資料從寫入器節點傳輸到僅供讀取複本的時間。
動作
根據等待事件的原因,我們會建議不同的動作。
調查中止交易的原因。
如果僅供讀取複本或寫入器資料庫執行個體受限於 CPU或 網路頻寬,請考慮將其變更為具有更多CPU容量或更多網路頻寬的執行個體類型。
IPC:AuroraWriteForwardXactCommit
當僅供讀取複本上的後端程序正在等待轉送遞交交易命令的結果時,就會發生IPC:AuroraWriteForwardXactCommit
事件。
等待時間增加的可能原因
等待時間增加的常見原因包括:
增加僅供讀取複本和寫入器節點之間的網路延遲,會增加讀取複本從寫入器節點接收資料所需的時間。
增加僅供讀取複本的負載可能會延遲查詢請求從僅供讀取複本傳輸到寫入器節點。
寫入器節點上增加的負載可能會延遲資料從寫入器節點傳輸到僅供讀取複本的時間。
動作
如果僅供讀取複本或寫入器節點受限於 CPU或 網路頻寬,請考慮將其變更為具有更多CPU容量或更多網路頻寬的執行個體類型。
IPC:AuroraWriteForwardXactStart
當僅供讀取複本上的後端程序正在等待轉送開始交易命令的結果時,就會發生IPC:AuroraWriteForwardXactStart
事件。
等待時間增加的可能原因
等待時間增加的常見原因包括:
增加僅供讀取複本和寫入器節點之間的網路延遲,會增加讀取複本從寫入器節點接收資料所需的時間。
增加僅供讀取複本的負載可能會延遲查詢請求從僅供讀取複本傳輸到寫入器節點。
寫入器節點上增加的負載可能會延遲資料從寫入器節點傳輸到僅供讀取複本的時間。
動作
如果僅供讀取複本或寫入器節點受限於 CPU或 網路頻寬,請考慮將其變更為具有更多CPU容量或更多網路頻寬的執行個體類型。