CloudWatch definizioni statistiche - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

CloudWatch definizioni statistiche

Le statistiche sono aggregazioni di dati di parametri durante determinati periodi di tempo. Quando si tracciano grafici o si recuperano le statistiche per un parametro, è necessario specificare il valore Periodo (Periodo di tempo), ad esempio cinque minuti, da utilizzare per calcolare ogni valore statistico. Ad esempio, se il valore Period (Periodo di tempo) è 5 minuti, il valore Sum (Somma) è la somma di tutti i valori campione raccolti durante il periodo di cinque minuti, mentre il valore Minimum (Minimo) è il valore più basso raccolto durante il periodo di cinque minuti.

CloudWatch supporta le seguenti statistiche per le metriche.

  • SampleCountè il numero di punti dati durante il periodo.

  • Sum (Somma) è la somma dei valori di tutti i punti dati raccolti durante il periodo.

  • Average (Media) è il valore di Sum/SampleCount durante il periodo specificato.

  • Minimum (Minimo) è valore più basso osservato durante il periodo specificato.

  • Maximum (Massimo) è il valore più alto osservato durante il periodo specificato.

  • Percentile (p) (Percentile) indica lo stato relativo di un valore in un set di dati. Ad esempio, p95 è il 95° percentile e vuol dire che il 95% dei dati entro il periodo è inferiore a questo valore e il 5% dei dati è superiore a questo valore. I percentili aiutano a comprendere meglio la distribuzione dei dati del parametro.

  • Trimmed mean (TM) (Media troncata) è la media di tutti i valori che si trovano tra due limiti specificati. I valori al di fuori dei limiti vengono ignorati quando viene calcolata la media. I limiti vengono definiti come uno o due numeri compresi tra 0 e 100, fino a 10 cifre decimali. I numeri possono essere valori assoluti o percentuali. Ad esempio, tm90 calcola la media dopo aver rimosso il 10% dei punti dati con i valori più alti. TM(2%:98%) calcola la media dopo aver rimosso i punti dati più bassi del 2% e i punti dati più alti del 2%. TM(150:1000) calcola la media dopo aver rimosso tutti i punti dati inferiori o uguali a 150 o superiori a 1000.

  • Interquartile mean (IQM) (Media interquartile) è la media troncata dell'intervallo interquartile, o il 50% medio dei valori. Equivale a TM(25%:75%).

  • Winsorized mean (WM) (Media winsorizzata) è simile alla media troncata. Tuttavia, con la media winsorizzata, i valori che si trovano al di fuori dell'edge non vengono ignorati, ma sono considerati uguali al valore al margine del limite appropriato. Dopo questa normalizzazione, viene calcolata la media. I limiti vengono definiti come uno o due numeri compresi tra 0 e 100, fino a 10 cifre decimali. Ad esempio, wm98 calcola la media trattando il 2% dei valori più alti in modo che sia uguale al valore al 98° percentile. WM(10%:90%) calcola la media trattando il 10% più alto dei punti dati come valore del limite del 90% e trattando il 10% più basso dei punti dati come valore del limite del 10%.

  • Percentile rank (PR) (Rango percentile) è la percentuale di valori che soddisfano una soglia fissa. Ad esempio, PR(:300) restituisce la percentuale di punti dati che hanno un valore pari o inferiore a 300. PR(100:2000) restituisce la percentuale di punti dati che hanno un valore compreso tra 100 e 2000.

    Il rango percentile è esclusivo nel limite inferiore e inclusivo nel limite superiore.

  • Trimmed count (TC) (Conteggio troncato) è il numero di punti dati nell'intervallo scelto per una statistica media troncata. Ad esempio, tc90 restituisce il numero di punti dati che non includono punti dati che rientrano nel 10% più alto dei valori. TC(0.005:0.030) restituisce il numero di punti dati con valori compresi tra 0,005 (escluso) e 0,030 (incluso).

  • Trimmed sum (TC) (Somma troncata) è la somma dei valori dei punti dati in un intervallo scelto per una statistica media troncata. È equivalente a (Media troncata) * (Conteggio troncato). Ad esempio, ts90 restituisce la somma dei punti dati che non includono punti dati che rientrano nel 10% più alto dei valori. TS(80%:) restituisce la somma dei valori dei punti dati, esclusi i punti dati con valori nell'80% più basso dell'intervallo di valori.

Nota

Per Trimmed Mean (Media troncata), Trimmed Count (Conteggio troncato), Trimmed Sum (Somma troncata) e Winsorized Mean (Media winsorizzata), se si definiscono due limiti come valori fissi anziché percentuali, il calcolo include valori uguali al limite superiore, ma non i valori uguali al limite inferiore.

Sintassi

Per Trimmed Mean (Media troncata), Trimmed Count (Conteggio troncato), Trimmed Sum (Somma troncata) e Winsorized Mean (Media winsorizzata), si applicano le seguenti regole di sintassi:

  • L'utilizzo di parentesi con uno o due numeri con segni di percentuale definisce i limiti da utilizzare come valori nel set di dati compresi tra i due percentili specificati. Ad esempio, TM(10%:90%) utilizza solo i valori compresi tra il decimo e il 90° percentile. TM(:95%) utilizza i valori dall'estremità più bassa del set di dati fino al 95° percentile, ignorando il 5% dei punti dati con i valori più alti.

  • L'utilizzo di parentesi senza uno o due numeri con segni di percentuale definisce i limiti da utilizzare come valori nel set di dati compresi tra i valori espliciti specificati. Ad esempio, TC(80:500) utilizza solo i valori compresi tra 80 (escluso) e 500 (incluso). TC(:0.5) utilizza solo i valori che sono uguali o inferiori a 0,5.

  • L'utilizzo di un numero senza parentesi consente di calcolare le percentuali, ignorando i punti dati superiori al percentile specificato. Ad esempio, tm99 calcola la media ignorando l'1% dei punti dati con il valore più alto. È uguale a TM(:99%).

  • Trimmed Mean (Media troncata), Trimmed Count (Conteggio troncato), Trimmed Sum (Somma troncata) e Winsorized Mean (Media winsorizzata) possono essere abbreviati utilizzando lettere maiuscole quando si specifica un intervallo, ad esempio TM(5%:95%), TM(100:200) o TM(:95%). Possono essere abbreviati solo utilizzando lettere minuscole quando si specifica un solo numero, ad esempio tm99.

Casi d'uso della statistica

  • Trimmed mean (Media troncata) è più utile per i parametri con una dimensione di esempio di grandi dimensioni, ad esempio la latenza della pagina Web. Ad esempio, tm99 ignora i valori anomali estremi che potrebbero derivare da problemi di rete o errori umani, per dare un numero più accurato per la latenza media delle richieste tipiche. Allo stesso modo, TM(10%:) ignora il 10% più basso dei valori di latenza, come quelli risultanti dai riscontri nella cache. E TM (10%:99%) esclude entrambi questi tipi di valori anomali. Ti consigliamo di utilizzare la media tagliata per il monitoraggio della latenza.

  • È una buona idea tenere d'occhio il conteggio troncato ogni volta che si utilizza la media troncata, per assicurarti che il numero di valori utilizzati nei calcoli della media troncata sia sufficiente per essere statisticamente significativo.

  • Il rango percentile consente di inserire valori in “contenitori” di intervalli, ed è possibile utilizzarlo per creare manualmente un istogramma. Per fare ciò, suddividi i tuoi valori in vari contenitori, come PR(:1), PR(1:5), PR(5:10) e PR(10:). Metti ciascun contenitore in una visualizzazione come grafici a barre così da avere un istogramma.

    Il rango percentile è esclusivo nel limite inferiore e inclusivo nel limite superiore.

Percentili rispetto alla media troncata

Un percentile come p99 e una media troncata come tm99 misurano valori simili, ma non identici. Sia p99 che tm99 ignorano l'1% dei punti dati con i valori più alti, che sono considerati valori anomali. Dopo di che, p99 è valore massimo del restante 99%, mentre tm99 è la media del restante 99%. Se stai guardando la latenza delle richieste Web ,p99 indica la peggiore esperienza cliente, ignorando i valori anomali, mentre tm99 indica l'esperienza cliente media, ignorando i valori anomali.

La media troncata è una buona statistica di latenza da guardare se stai cercando di ottimizzare la tua esperienza cliente.

Requisiti per l'uso di percentili, media troncata e altre statistiche

CloudWatch necessita di punti dati grezzi per calcolare le seguenti statistiche:

  • Percentili

  • Media troncata

  • Media Interquartile

  • Media winsorizzata

  • Somma troncata

  • Conteggio troncato

  • Rango percentile

Se pubblichi dati per una statistica personalizzata utilizzando un set di statistiche invece di dati non elaborati, puoi recuperare questi tipi di statistiche dei percentili per questi dati solo se risulta vera una delle seguenti condizioni:

  • Il SampleCount valore del set di statistiche è 1 e Min, Max e Sum sono tutti uguali.

  • Min e Max sono uguali e Sum è uguale a Min moltiplicato per. SampleCount

I seguenti AWS servizi includono metriche che supportano questi tipi di statistiche.

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Sistema di bilanciamento del carico elastico

  • Kinesis

  • Amazon RDS

Inoltre questi tipi di statistiche non sono disponibili per i parametri quando uno qualsiasi dei valori dei parametri è un numero negativo.