Amazon Redshift 中的性能數據 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Redshift 中的性能數據

使用 Amazon Redshift 的 CloudWatch 指標,您可以取得叢集運作狀態和效能的相關資訊,並查看節點層級的資訊。使用這些指標時,請謹記每個指標都有一或多個與其關聯的維度。您可透過這些維度來知道指標適用的項目,也就是指標的範圍。Amazon Redshift 具有以下兩個維度:

  • 具有 NodeID 維度的指標即為提供叢集的節點之效能資料的指標。這組指標包含領導與運算節點。這些指標的範例包括:CPUUtilizationReadIOPSWriteIOPS

  • 僅具有 ClusterIdentifier 維度的指標即為提供叢集之效能資料的指標。這些指標的範例包括:HealthStatusMaintenanceMode

    注意

    在這些指標案例中,叢集特定指標代表的是節點行為的彙總。在這些案例中,請留意指標值的解譯,因為領導節點的行為會透過運算節點來彙總。

有關指 CloudWatch 標和維度的一般資訊,請參閱 Amazon CloudWatch 使用者指南中的CloudWatch 概念

如需 Amazon Redshift CloudWatch 指標的進一步說明,請參閱以下各節。

Amazon Redshift 指標

AWS/Redshift 命名空間包含下列指標。除非另有說明,否則會每隔 1 分鐘收集指標。

Title
指標 描述
CommitQueueLength

在指定時間點等待認可的交易數目。

單位:計數

維度:ClusterIdentifier

ConcurrencyScalingActiveClusters

在任何指定時間主動處理查詢的並行擴展叢集數量。

單位:計數

維度:ClusterIdentifier

ConcurrencyScalingSeconds

有主動查詢處理活動的並行擴展叢集所使用的秒數。

單位:計數

維度:ClusterIdentifier

CPUUtilization

CPU使用率的百分比。對於叢集,此指標代表所有節點 (領導節點和運算) CPU 使用率值的彙總。

單位:百分比

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

DatabaseConnections

叢集的資料庫連線數量。

單位:計數

維度:ClusterIdentifier

HealthStatus

表示叢集運作狀態。叢集每分鐘連線至其資料庫並執行建議查詢。如果成功執行此操作,該叢集將被視為運作正常。否則,表示該叢集運作不良。不良狀態可能會發生於資料庫處於極高負載,或叢集上的資料庫有組態的問題。

注意

在 Amazon 中 CloudWatch,此指標報告為 1 或 0,而在 Amazon Redshift 控制台中,此指標與文字一起顯示HEALTHYUNHEALTHY為了方便起見。此指標顯示於 Amazon Redshift 主控台時,將忽略取樣平均值,只會顯示 HEALTHYUNHEALTHY。在 Amazon 中 CloudWatch,由於採樣問題,可能會出現與 1 和 0 不同的值。小於 1 的任何 HealthStatus 值都將回報為 0 (UNHEALTHY)。

單位:計數 (1/0) (在 Amazon Redshift 主控台中為 HEALTHY/UNHEALTHY)

維度:ClusterIdentifier

MaintenanceMode

表示叢集是否處於維護模式。

注意

在 Amazon 中 CloudWatch,此指標報告為 1 或 0,而在 Amazon Redshift 控制台中,此指標與文字一起顯示ONOFF為了方便起見。此指標顯示於 Amazon Redshift 主控台時,將忽略取樣平均值,只會顯示 ONOFF。在 Amazon 中 CloudWatch,由於採樣問題,可能會出現與 1 和 0 不同的值。大於 0 的任何 MaintenanceMode 值都將回報為 1 (ON)。

單位:計數 (1/0) (在 Amazon Redshift 主控台中為 ON/OFF)。

維度:ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

從參數群組設定檔最大並行擴展叢集數量。如需詳細資訊,請參閱 Amazon Redshift 參數群組

單位:計數

維度:ClusterIdentifier

NetworkReceiveThroughput

節點或叢集接收資料的速率。

單位:位元組/秒 (在 Amazon Redshift 主控台中為 MB/秒)

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

NetworkTransmitThroughput

節點或叢集寫入資料的速率。

單位:位元組/秒 (在 Amazon Redshift 主控台中為 MB/秒)

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

PercentageDiskSpaceUsed

已使用的磁碟空間的百分比。

單位:百分比

維度:ClusterIdentifier

尺寸: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

平均每秒完成的查詢次數。每隔 5 分鐘回報。單節點叢集不支援此指標。

單位:計數/秒

尺寸: ClusterIdentifier, latency

尺寸: ClusterIdentifier, wlmid

QueryDuration

完成查詢的平均時間。每隔 5 分鐘回報。單節點叢集不支援此指標。

單位:微秒

維度:ClusterIdentifierNodeIDlatency

尺寸: ClusterIdentifier, latency

維度:ClusterIdentifierNodeIDwlmid

QueryRuntimeBreakdown

查詢階段執行所花費的查詢總時間。每隔 5 分鐘回報。

單位:毫秒

尺寸: ClusterIdentifier,NodeID,階段

尺寸: ClusterIdentifier,舞台

ReadIOPS

磁碟讀取操作的每秒平均次數。

單位:計數/秒

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

ReadLatency

用於磁碟讀取 I/O 操作的平均時間量。

單位:秒

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

ReadThroughput

平均每秒從磁碟讀取的位元組數目。

單位:位元組 (在 Amazon Redshift 主控台中為 GB/秒)

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

RedshiftManagedStorageTotalCapacity

受管儲存總容量。

單位:MB

維度:ClusterIdentifier

TotalTableCount

在特定時間點開啟的使用者資料表數。這個總計不包括 Amazon Redshift Spectrum 資料表。

單位:計數

維度:ClusterIdentifier

WLMQueueLength

等待進入工作負載管理 (WLM) 佇列的查詢數目。

單位:計數

尺寸: ClusterIdentifier, service class

尺寸: ClusterIdentifier, QueueName

WLMQueueWaitTime

在工作負載管理 (WLM) 佇列中等待的查詢總時間。每隔 5 分鐘回報。

單位:毫秒。

尺寸: ClusterIdentifier, QueryPriority

尺寸: ClusterIdentifier, wlmid

尺寸: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

工作負載管理 (WLM) 佇列每秒完成的平均查詢數目。每隔 5 分鐘回報。單節點叢集不支援此指標。

單位:計數/秒

尺寸: ClusterIdentifier, wlmid

尺寸: ClusterIdentifier, QueueName

WLMQueryDuration

完成工作負載管理 (WLM) 佇列查詢的平均時間長度。每隔 5 分鐘回報。單節點叢集不支援此指標。

單位:微秒

尺寸: ClusterIdentifier, wlmid

尺寸: ClusterIdentifier, QueueName

WLMRunningQueries

從主叢集和每個WLM佇列並行擴展叢集執行的查詢數目。

單位:計數

尺寸: ClusterIdentifier, wlmid

尺寸: ClusterIdentifier, QueueName

WriteIOPS

寫入操作的每秒平均次數。

單位:計數/秒

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

WriteLatency

用於磁碟寫入 I/O 操作的平均時間量。

單位:秒

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

WriteThroughput

平均每秒寫入磁碟的位元組數目。

單位:位元組 (在 Amazon Redshift 主控台中為 GB/秒)

尺寸: ClusterIdentifier, NodeID

維度:ClusterIdentifier

SchemaQuota

所設定的結構描述配額。

單位:MB

維度:ClusterIdentifierDatabaseSchema

定期/推送:Periodic

頻率:5 minutes

停止條件:已捨棄結構描述或已移除配額

NumExceededSchemaQuotas

超出配額的結構描述數目。

單位:計數

維度:ClusterIdentifier

定期/推送:Periodic

頻率:5 minutes

停止條件:無

StorageUsed

結構描述使用的磁碟或儲存空間。

單位:MB

維度:ClusterIdentifierDatabaseSchema

定期/推送:Periodic

頻率:5 minutes

停止條件:已捨棄結構描述或已移除配額

PercentageQuotaUsed

已使用的磁碟或儲存空間相對於已設定的結構描述配額的百分比。

單位:百分比

維度:ClusterIdentifierDatabaseSchema

定期/推送:Periodic

頻率:5 minutes

停止條件:已捨棄結構描述或已移除配額

UsageLimitAvailable

根據 FeatureType,傳 UsageLimitAvailable 回下列內容:

  • 如果 FeatureType 是CONCURRENCY_SCALING,則 UsageLimitAvailable傳回以 1 分鐘為增量的並行縮放可使用的總時間量。

  • 如果 FeatureType 是CROSS_REGION_DATASHARING,則 UsageLimitAvailable 傳回可以以 1 TB 為增量掃描的資料總量。

  • 如果 FeatureType 是SPECTRUM,則 UsageLimitAvailable 傳回可以以 1 TB 為增量掃描的資料總量。

單位:分鐘或 TBs

維度:ClusterIdentifierFeatureTypeUsageLimitId

UsageLimitConsumed

根據 FeatureType,傳 UsageLimitConsumed 回下列內容:

  • 如果 FeatureType 是CONCURRENCY_SCALING,則 UsageLimitAvailable傳回並行縮放所使用的總時間量 (以 1 分鐘為增量)。

  • 如果 FeatureType 是CROSS_REGION_DATASHARING,則 UsageLimitAvailable 傳回以 1 TB 為增量掃描的資料總量。

  • 如果 FeatureType 是SPECTRUM,則 UsageLimitAvailable 傳回以 1 TB 為增量掃描的資料總量。

單位:分鐘或 TBs

維度:ClusterIdentifierFeatureTypeUsageLimitId

Amazon Redshift 指標的維度

Amazon Redshift 資料可依下表中任何維度進行篩選。

維度 描述
latency

可能的值如下:

  • 短 — 少於 10 秒

  • 中 — 介於 10 秒到 10 分鐘

  • 長 — 超過 10 分鐘

NodeID

篩選專屬於某個叢集的節點的資料。NodeID 可以是「Leader」、「Shared」或「Compute-N」,其中的 N 是 0, 1, ...,亦即叢集中的節點數量。「Shared」表示該叢集只有一個節點,例如領導節點與運算節點結合。

領導者節點與運算節點回報的指標只有 CPUUtilizationNetworkTransmitThroughputReadIOPS。只有運算節點會回報使用 NodeId 維度的其他指標。

ClusterIdentifier

篩選專屬於某個叢集的資料。專屬於叢集的指標包括 HealthStatusMaintenanceModeDatabaseConnections。通常,此維度中的指標 (例如 ReadIOPS) 也是代表節點指標資料彙總的節點指標。在解譯這些指標時應特別注意,因為它們彙整了領導與運算節點的行為。

service class

WLM 服務類別的識別碼。

stage

查詢的執行階段。可能的值如下:

  • QueryPlanning: 剖析和最佳化SQL陳述式所花費的時間。

  • QueryWaiting:等待WLM佇列所花費的時間。

  • QueryExecutingRead:執行讀取查詢所花費的時間。

  • QueryExecutingInsert:執行插入查詢所花費的時間。

  • QueryExecutingDelete:執行刪除查詢所花費的時間。

  • QueryExecutingUpdate:執行更新查詢所花費的時間。

  • QueryExecutingCtas:執行建立資料表做為查詢所花費的時間。

  • QueryExecutingUnload:執行卸載查詢所花費的時間。

  • QueryExecutingCopy:執行複製查詢所花費的時間。

  • QueryCommit:承諾所花費的時間。

wlmid

工作負載管理佇列的識別碼。

QueryPriority

查詢的優先順序。可能值為 CRITICALHIGHESTHIGHNORMALLOW 以及 LOWEST

QueueName

工作負載管理佇列的名稱。

FeatureType

受限於使用限制值的功能。可能值為 CONCURRENCY_SCALINGCROSS_REGION_DATASHARINGSPECTRUM

UsageLimitId

用於限制用量的識別符。

Amazon Redshift 查詢和載入效能資料

除了 CloudWatch 指標之外,Amazon Redshift 還提供查詢和載入效能資料。查詢和載入效能資料可用來協助您了解資料庫效能和叢集指標間的關係。例如,如果您注意到叢集的CPU尖峰,您可以在叢集CPU圖形上找到尖峰,並查看當時正在執行的查詢。相反地,如果您要檢閱特定查詢,測量結果資料 (類似CPU) 會顯示在內容中,以便您瞭解查詢對叢集度量的影響。

查詢和載入效能資料不會以 CloudWatch 指標形式發佈,而且只能在 Amazon Redshift 主控台中檢視。查詢和載入效能資料會透過查詢資料庫的系統資料表來產生 (如需詳細資訊,請參閱《Amazon Redshift 開發人員指南》中的系統資料表參考)。您也可以產生自己的自定資料庫效能查詢,但我們建議開始從在主控台中呈現的查詢和載入效能資料開始。如需自行測量和監控資料庫效能的相關資訊,請參閱《Amazon Redshift 開發人員指南》中的管理效能

以下資料表說明您可以在 Amazon Redshift 主控台中存取之查詢和載入資料的不同層面。

查詢/載入資料 描述
查詢摘要

在特定期間的查詢清單。可以根據查詢 ID、查詢執行時間和狀態等值排序清單。請在叢集詳細資訊頁面的 Query monitoring (查詢監控) 標籤中檢視此資料。

查詢詳細資訊

提供包含以下項目之特定查詢的詳細資訊:

  • 查詢 ID、類型、執行查詢的叢集和執行時間等查詢屬性。

  • 查詢狀態和錯誤數之類的詳細資訊。

  • 執行的SQL陳述式。

  • 解釋計畫 (如果有)。

  • 查詢執行期間的叢集效能資料 (如需詳細資訊,請參閱 檢視查詢歷史記錄資料)。

載入摘要

列出在特定期間的所有載入。可以根據查詢 ID、查詢執行時間和狀態等值排序清單。請在叢集詳細資訊頁面的 Query monitoring (查詢監控) 標籤中檢視此資料。

載入詳細資訊

提供包含以下項目之特定載入操作的詳細資訊:

  • 查詢 ID、類型、執行查詢的叢集和執行時間等載入屬性。

  • 載入狀態和錯誤數之類的詳細資訊。

  • 執行的SQL陳述式。

  • 載入檔案清單。

  • 載入操作期間的叢集效能資料 (如需詳細資訊,請參閱 檢視查詢歷史記錄資料)。