Monitoraggio di Amazon Redshift tramite metriche CloudWatch - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio di Amazon Redshift tramite metriche CloudWatch

Utilizzando i CloudWatch parametri per Amazon Redshift, puoi ottenere informazioni sullo stato e le prestazioni del cluster e visualizzare le informazioni a livello di nodo. Quando utilizzi tali parametri, considera che a ogni parametro sono associate una o più dimensioni. Queste dimensioni indicano a cosa si applica il parametro, ovvero l'ambito del parametro. Amazon Redshift ha le seguenti due dimensioni:

  • I parametri con la dimensione NodeID sono quelli che forniscono dati di prestazioni per i nodi di un cluster. Questo set di parametri include nodi principali e di calcolo. Esempi di questi parametri sono CPUUtilization, ReadIOPS, WriteIOPS.

  • I parametri con unicamente la dimensione ClusterIdentifier sono quelli che forniscono dati di prestazioni per i cluster. Esempi di questi parametri sono HealthStatus e MaintenanceMode.

    Nota

    In alcuni casi, un parametro specifico ai cluster rappresenta un'aggregazione del comportamento dei nodi. In questi casi, presta attenzione all'interpretazione del valore del parametro in quanto il comportamento del nodo principale viene aggregato a quello del nodo di calcolo.

Per informazioni generali su CloudWatch metriche e dimensioni, consulta CloudWatch i concetti nella Amazon CloudWatch User Guide.

Per un'ulteriore descrizione dei CloudWatch parametri per Amazon Redshift, consulta le seguenti sezioni.

Parametri di Amazon Redshift

Lo spazio dei nomi AWS/Redshift include i parametri descritti di seguito. Salvo diversa indicazione, i parametri vengono raccolti a intervalli di 1 minuto.

Title
Parametro Descrizione
CommitQueueLength

Il numero di transazioni in attesa di eseguire il commit in un dato momento.

Unità: numero

Dimensioni: ClusterIdentifier

ConcurrencyScalingActiveClusters

Il numero di cluster di dimensionamento simultaneo che elaborano attivamente le query in qualsiasi momento.

Unità: numero

Dimensioni: ClusterIdentifier

ConcurrencyScalingSeconds

Il numero di secondi impiegati dai cluster di dimensionamento simultaneo con attività di elaborazione di query attiva.

Unità: numero

Dimensioni: ClusterIdentifier

CPUUtilization

La percentuale di utilizzo della CPU. Per i cluster, questo parametro rappresenta un'aggregazione dei valori di utilizzo della CPU di tutti i nodi (singolo e calcolo).

Unità: percentuale

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

DatabaseConnections

Il numero di connessioni di database a un cluster.

Unità: numero

Dimensioni: ClusterIdentifier

HealthStatus

Indica lo stato del cluster. Il cluster si connette al proprio database ed esegue una semplice query ogni minuto. Se è in grado di eseguire questa operazione correttamente, il cluster è considerato integro. In caso contrario, il cluster non è integro. Uno stato non integro può verificarsi quando il database del cluster è sovraccaricato eccessivamente oppure se si verifica un problema di configurazione con un database sul cluster.

Nota

In Amazon CloudWatch, questa metrica viene riportata come 1 o 0, mentre nella console Amazon Redshift viene visualizzata con le HEALTHY parole UNHEALTHY o per comodità. Quando questo parametro è visualizzato nella console Amazon Redshift, le medie di campionamento vengono ignorate e viene visualizzato solo HEALTHY o UNHEALTHY. In Amazon CloudWatch, potrebbero verificarsi valori diversi da 1 e 0 a causa di problemi di campionamento. Qualsiasi valore inferiore a 1 per HealthStatus è segnalato come 0 (UNHEALTHY).

Unità: conteggio (1/0) (HEALTHY/UNHEALTHY nella console Amazon Redshift)

Dimensioni: ClusterIdentifier

MaintenanceMode

Indica se il cluster è in modalità di manutenzione.

Nota

In Amazon CloudWatch, questa metrica viene riportata come 1 o 0, mentre nella console Amazon Redshift viene visualizzata con le ON parole OFF o per comodità. Quando questo parametro è visualizzato nella console Amazon Redshift, le medie di campionamento vengono ignorate e viene visualizzato solo ON o OFF. In Amazon CloudWatch, potrebbero verificarsi valori diversi da 1 e 0 a causa di problemi di campionamento. Qualsiasi valore maggiore di 0 per MaintenanceMode è segnalato come 1 (ON).

Unità: conteggio (1/0) (ON/OFF nella console Amazon Redshift)

Dimensioni: ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

Numero massimo di cluster di dimensionamento simultaneo configurati dal gruppo di parametri. Per ulteriori informazioni, consultare Gruppi di parametri di Amazon Redshift..

Unità: numero

Dimensioni: ClusterIdentifier

NetworkReceiveThroughput

La velocità alla quale il nodo o il cluster riceve i dati.

Unità: byte/s (MB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

NetworkTransmitThroughput

La velocità alla quale il nodo o il cluster scrive i dati.

Unità: byte/s (MB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

PercentageDiskSpaceUsed

La percentuale di spazio su disco utilizzata.

Unità: percentuale

Dimensioni: ClusterIdentifier

Dimensioni: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

Numero medio di query eseguite al secondo. Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, latency

Dimensioni: ClusterIdentifier, wlmid

QueryDuration

Il tempo medio necessario per il completamento di una query. Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: microsecondi

Dimensioni: ClusterIdentifier, NodeID, latency

Dimensioni: ClusterIdentifier, latency

Dimensioni: ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

Il tempo totale impiegato dalle query in esecuzione per fase di query. Segnalato in intervalli di 5 minuti.

Unità: millisecondi

Dimensioni: ClusterIdentifier, NodeID, stage

Dimensioni: stage ClusterIdentifier

ReadIOPS

Il numero medio di operazioni di lettura del disco al secondo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

ReadLatency

La quantità di tempo media che occorre per effettuare operazioni I/O di lettura del disco.

Unità: secondi

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

ReadThroughput

Il numero medio di byte letti dal disco al secondo.

Unità: byte (GB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

RedshiftManagedStorageTotalCapacity

Capacità totale di archiviazione gestita.

Unità: megabyte

Dimensioni: ClusterIdentifier

TotalTableCount

Il numero di tabelle utente aperte in un particolare momento. Questo totale non include le tabelle di Amazon Redshift Spectrum.

Unità: numero

Dimensioni: ClusterIdentifier

WLMQueueLength

Il numero di query in attesa di entrare in una coda Workload Management (WLM).

Unità: numero

Dimensioni: ClusterIdentifier, service class

Dimensioni: ClusterIdentifier, QueueName

WLMQueueWaitTime

Tempo totale trascorso dalle query in attesa nella coda workload management (WLM) Segnalato in intervalli di 5 minuti.

Unità: millisecondi

Dimensioni: ClusterIdentifier, QueryPriority

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Numero medio di query eseguite al secondo per una coda Workload Management (WLM). Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMQueryDuration

Durata media temporale per il completamento di una query per una coda Workload Management (WLM). Segnalato in intervalli di 5 minuti. Questa metrica non è supportata nei cluster a nodo singolo.

Unità: microsecondi

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WLMRunningQueries

Il numero di query in esecuzione sia dal cluster principale che da quello di dimensionamento simultaneo per coda WLM.

Unità: numero

Dimensioni: ClusterIdentifier, wlmid

Dimensioni: ClusterIdentifier, QueueName

WriteIOPS

Il numero medio di operazioni di scrittura al secondo.

Unità: conteggio/secondo

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

WriteLatency

La quantità di tempo media che occorre per effettuare operazioni I/O di scrittura sul disco.

Unità: secondi

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

WriteThroughput

Il numero medio di byte scritti sul disco al secondo.

Unità: byte (GB/s nella console Amazon Redshift)

Dimensioni: ClusterIdentifier, NodeID

Dimensioni: ClusterIdentifier

SchemaQuota

La quota configurata per uno schema.

Unità: megabyte

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

NumExceededSchemaQuotas

Il numero di schemi con quote superate.

Unità: numero

Dimensioni: ClusterIdentifier

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di arresto: N/D

StorageUsed

Il disco o lo spazio di archiviazione utilizzato da uno schema.

Unità: megabyte

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

PercentageQuotaUsed

La percentuale di spazio su disco o di archiviazione utilizzato rispetto alla quota dello schema configurata.

Unità: percentuale

Dimensioni: ClusterIdentifier, Database, Schema

Periodico/Push: Periodic

Frequenza: 5 minutes

Criteri di interruzione: schema eliminato o quota rimossa

UsageLimitAvailable

A seconda di FeatureType, UsageLimitAvailable restituisce quanto segue:

  • Se FeatureType èCONCURRENCY_SCALING, UsageLimitAvailable restituisce la quantità di tempo totale che può essere utilizzata mediante il ridimensionamento simultaneo in incrementi di 1 minuto.

  • Se FeatureType èCROSS_REGION_DATASHARING, UsageLimitAvailable restituisce la quantità totale di dati che è possibile scansionare con incrementi di 1 TB.

  • In caso FeatureType affermativoSPECTRUM, UsageLimitAvailable restituisce la quantità totale di dati che è possibile scansionare con incrementi di 1 TB.

Unità: minuti o TB

Dimensioni: ClusterIdentifier, FeatureType, UsageLimitId

UsageLimitConsumed

A seconda di FeatureType, UsageLimitConsumed restituisce quanto segue:

  • Se FeatureType èCONCURRENCY_SCALING, UsageLimitAvailable restituisce la quantità totale di tempo utilizzata dal ridimensionamento simultaneo in incrementi di 1 minuto.

  • Se FeatureType èCROSS_REGION_DATASHARING, UsageLimitAvailable restituisce la quantità totale di dati scansionati con incrementi di 1 TB.

  • Se FeatureType èSPECTRUM, UsageLimitAvailable restituisce la quantità totale di dati scansionati con incrementi di 1 TB.

Unità: minuti o TB

Dimensioni: ClusterIdentifier, FeatureType, UsageLimitId

Dimensioni per i parametri di Amazon Redshift

I dati Amazon Redshift possono essere filtrati insieme alle dimensioni nella seguente tabella.

Dimensione Descrizione
latency

I valori possibili sono i seguenti:

  • breve: meno di 10 secondi

  • media: tra 10 secondi e 10 minuti

  • lunga: più di 10 minuti

NodeID

Filtra i dati richiesti che sono specifici dei nodi di un cluster. NodeID è "Leader", "Shared" o "Compute-N", dove N è 0, 1, ... per il numero di nodi nel cluster. "Shared" significa che il cluster ha solo un nodo, ovvero che il nodo principale e il nodo di calcolo sono combinati.

I parametri di CPUUtilization, NetworkTransmitThroughput e ReadIOPS vengono indicati solo per il nodo principale e i nodi di calcolo. Altri parametri che utilizzano la dimensione NodeId vengono indicati solo per i nodi di calcolo.

ClusterIdentifier

Filtra i dati richiesti che sono specifici del cluster. I parametri specifici dei cluster includono HealthStatus, MaintenanceMode e DatabaseConnections. I parametri generali per questa dimensione (ad esempio ReadIOPS) che sono anche parametri dei nodi rappresentano un'aggregazione dei dati dei parametri dei nodi. Presta attenzione nell'interpretare questi parametri in quanto aggregano il comportamento di nodi principali e nodi di calcolo.

service class

L'identificatore per una classe di servizio WLM.

stage

Le fasi dell'esecuzione per una query. I valori possibili sono i seguenti:

  • QueryPlanning: Tempo impiegato per l'analisi e l'ottimizzazione delle istruzioni SQL.

  • QueryWaiting: Tempo di attesa nella coda WLM.

  • QueryExecutingRead: Tempo impiegato per l'esecuzione di interrogazioni di lettura.

  • QueryExecutingInsert: Tempo impiegato per l'esecuzione delle interrogazioni di inserimento.

  • QueryExecutingDelete: tempo impiegato per l'esecuzione delle interrogazioni di eliminazione.

  • QueryExecutingUpdate: tempo impiegato per l'esecuzione delle interrogazioni di aggiornamento.

  • QueryExecutingCtas: tempo impiegato per l'esecuzione della creazione della tabella come query.

  • QueryExecutingUnload: tempo impiegato per l'esecuzione delle interrogazioni di scaricamento.

  • QueryExecutingCopy: tempo impiegato per l'esecuzione di interrogazioni di copia.

  • QueryCommit: tempo impiegato a impegnarsi.

wlmid

Identificatore per una coda di gestione dei carichi di lavoro.

QueryPriority

La priorità della query. I valori possibili sono CRITICAL, HIGHEST, HIGH, NORMAL, LOW e LOWEST.

QueueName

Nome della coda di gestione del carico di lavoro.

FeatureType

La funzionalità è vincolata da un limite di utilizzo. I valori possibili sono CONCURRENCY_SCALING, CROSS_REGION_DATASHARING e SPECTRUM.

UsageLimitId

L'identificatore di un limite di utilizzo.

Dati di prestazioni di query e caricamento di Amazon Redshift

Oltre alle CloudWatch metriche, Amazon Redshift fornisce dati sulle prestazioni di query e caricamento. Questi dati ti consentono di comprendere la relazione tra le prestazioni dei database e i parametri dei cluster. Ad esempio, se si verifica un picco nella CPU di un cluster, questo è indicato sul grafico della CPU del cluster e puoi quindi determinare le query che erano in esecuzione in quel momento. Al contrario, se esamini una specifica query, i dati dei parametri (come la CPU) sono visualizzati in contesto di modo che sia possibile comprendere l'impatto della query sui parametri del cluster.

I dati sulle prestazioni di query e carico non vengono pubblicati come CloudWatch metriche e possono essere visualizzati solo nella console Amazon Redshift. I dati relativi alle prestazioni di query e caricamenti sono generati a partire dalle query sulle tabelle di sistema del database (per ulteriori informazioni, consultare Riferimento delle tabelle di sistema nella Guida per gli sviluppatori di Amazon Redshift). Puoi anche generare query di prestazioni di database personalizzate, ma ti consigliamo di cominciare con i dati di prestazioni di query e di caricamento presentati nella console. Per ulteriori informazioni sulla misurazione e il monitoraggio delle prestazioni dei database, consultare Gestione delle prestazioni nella Guida per gli sviluppatori di Amazon Redshift.

La tabella seguente descrive i diversi aspetti dei dati di query e di caricamento accessibili nella console Amazon Redshift.

Dati di query/caricamento Descrizione
Riepilogo delle query

Un elenco di query in un determinato periodo di tempo. L'elenco può essere ordinato in base a valori come ID, tempo di esecuzione e stato della query. Visualizzare questi dati nella scheda Monitoraggio della query della pagina dei dettagli del cluster.

Dettagli della query

Fornisce dettagli su una determinata query, tra cui:

  • Proprietà della query come ID, tipo, cluster su cui la query è stata eseguita e tempo di esecuzione.

  • Dettagli come lo stato della query e il numero di errori.

  • L'istruzione SQL che è stata eseguita.

  • Un piano explain, se disponibile.

  • Dati sulle prestazioni del cluster durante l'esecuzione della query (per ulteriori informazioni, consultare Visualizzazione dei dati della cronologia delle query).

Riepilogo del caricamento

Elenca tutti i caricamenti in un determinato periodo di tempo. L'elenco può essere ordinato in base a valori come ID, tempo di esecuzione e stato della query. Visualizzare questi dati nella scheda Monitoraggio della query della pagina dei dettagli del cluster.

Dettagli del caricamento

Fornisce dettagli su una determinata operazione di caricamento, tra cui:

  • Proprietà del caricamento come ID, tipo, cluster su cui la query è stata eseguita e tempo di esecuzione.

  • Dettagli come lo stato del caricamento e il numero di errori.

  • L'istruzione SQL che è stata eseguita.

  • Un elenco di file caricati.

  • Dati sulle prestazioni del cluster durante l'operazione di caricamento (per ulteriori informazioni, consultare Visualizzazione dei dati della cronologia delle query).