CloudWatch definisi statistik - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

CloudWatch definisi statistik

Statistik adalah agregasi data metrik selama periode waktu tertentu. Saat Anda membuat grafik atau mengambil statistik untuk metrik, Anda menentukan Periode waktu, seperti lima menit, yang akan digunakan untuk menghitung setiap nilai statistik. Sebagai contoh, jika Periode lima menit, Jumlah adalah jumlah semua nilai sampel yang dikumpulkan selama periode lima menit, sedangkan Minimum adalah nilai terendah yang dikumpulkan selama periode lima menit.

CloudWatch mendukung statistik berikut untuk metrik.

  • SampleCountadalah jumlah titik data selama periode tersebut.

  • Jumlah adalah jumlah nilai dari semua titik data yang dikumpulkan selama periode tersebut.

  • Rata-rata adalah nilai dari Sum/SampleCount selama periode tertentu.

  • Minimum adalah nilai terendah yang diamati selama periode tertentu.

  • Maksimum adalah nilai tertinggi yang diamati selama periode tertentu.

  • Persentil (p) menunjukkan posisi relatif nilai dalam set data. Sebagai contoh, p95 adalah persentil ke-95 dan berarti bahwa 95 persen data dalam periode lebih rendah dari nilai ini dan 5 persen data lebih tinggi dari nilai ini. Persentil membantu Anda mendapatkan pemahaman yang lebih baik tentang distribusi data metrik Anda.

  • Rata-rata terpangkas (TM) adalah rata-rata dari semua nilai yang berada di antara dua batas yang ditentukan. Nilai di luar batas diabaikan ketika mean dihitung. Anda menetapkan batasnya dengan satu atau dua angka antara 0 dan 100, hingga 10 tempat desimal. Angka-angka dapat berupa nilai absolut atau persentase. Sebagai contoh, tm90 menghitung rata-rata setelah menghapus 10% titik data dengan nilai tertinggi. TM(2%:98%) menghitung rata-rata setelah menghapus titik data terendah 2% dan titik data tertinggi 2%. TM (150:1000) menghitung rata-rata setelah menghapus semua titik data yang lebih rendah dari atau sama dengan 150, atau lebih tinggi dari 1000.

  • Mean interkuartil (IQM) adalah rata-rata yang dipangkas dari rentang interkuartil, atau 50% nilai tengah. Ini setara dengan TM(25%:75%).

  • Rata-rata terpotong (WM) mirip dengan rata-rata terpangkas. Namun demikian, dengan winsorized mean, nilai yang berada di luar batas tidak diabaikan, tetapi dianggap sama dengan nilai di edge batas yang sesuai. Setelah normalisasi ini, rata-rata dihitung. Anda menetapkan batasnya dengan satu atau dua angka antara 0 dan 100, hingga 10 tempat desimal. Sebagai contoh, wm98 menghitung rata-rata sambil memperlakukan 2% dari nilai tertinggi agar sama dengan nilai pada persentil ke 98. WM(10%:90%) menghitung rata-rata sambil memperlakukan 10% titik data tertinggi sebagai nilai batas 90%, dan memperlakukan 10% titik data terendah sebagai nilai batas 10%.

  • Peringkat persentil (PR) adalah persentase nilai yang memenuhi ambang batas tetap. Sebagai contoh, PR(:300) mengembalikan persentase titik data yang memiliki nilai 300 atau kurang. PR(100:2000) mengembalikan persentase titik data yang memiliki nilai antara 100 dan 2000.

    Peringkat persentil eksklusif pada batas bawah dan inklusif di batas atas.

  • Hitungan terpangkas (TC) adalah jumlah titik data yang ada dalam rentang yang dipilih untuk statistik rata-rata terpangkas. Sebagai contoh, tc90 mengembalikan jumlah titik data yang tidak termasuk titik data apa pun yang termasuk dalam 10% nilai tertinggi. TC(0.005:0.030) mengembalikan jumlah titik data dengan nilai antara 0,005 (eksklusif) dan 0,030 (inklusif).

  • Jumlah terpangkas (TS) adalah jumlah nilai-nilai titik data yang ada dalam rentang yang dipilih untuk statistik rata-rata terpangkas. Ini setara dengan (Rata-rata Terpangkas) * (Hitungan Terpangkas). Sebagai contoh, ts90 mengembalikan jumlah titik data yang tidak termasuk titik data apa pun yang termasuk dalam 10% nilai tertinggi. TS(80%:) mengembalikan jumlah nilai titik data, tidak termasuk titik data apa pun dengan nilai di 80% terendah dari rentang nilai.

catatan

Untuk Rata-rata Terpangkas, Hitungan Terpangkas, Jumlah Terpangkas, dan Rata-rata Terpotong, jika Anda mendefinisikan dua batas sebagai nilai tetap alih-alih persentase, penghitungan mencakup nilai yang sama dengan batas yang lebih tinggi, tetapi tidak termasuk nilai yang sama dengan batas bawah.

Sintaks

Untuk Rata-rata Terpangkas, Hitungan Terpangkas, Jumlah Terpangkas, dan Rata-rata Terpotong, aturan sintaks berikut berlaku:

  • Menggunakan tanda kurung dengan satu atau dua angka dengan tanda persen mendefinisikan batas yang akan digunakan sebagai nilai dalam set data yang berada di antara dua persentil yang Anda tentukan. Sebagai contoh, TM(10%:90%) hanya menggunakan nilai antara persentil ke 10 dan ke 90. TM(:95%) menggunakan nilai dari ujung terendah set data yang diatur hingga persentil ke 95, mengabaikan 5% titik data dengan nilai tertinggi.

  • Menggunakan tanda kurung dengan satu atau dua angka tanpa tanda persen mendefinisikan batas yang akan digunakan sebagai nilai dalam set data yang berada di antara nilai eksplisit yang Anda tentukan. Sebagai contoh, TC(80:500) hanya menggunakan nilai antara 80 (eksklusif) dan 500 (inklusif). TC(:0.5) hanya menggunakan nilai yang sama dengan 0,5 atau lebih rendah.

  • Menggunakan satu angka tanpa tanda kurung menghitung menggunakan persentase, mengabaikan titik data yang lebih tinggi dari persentil yang ditentukan. Sebagai contoh, tm99 menghitung mean sambil mengabaikan 1% titik data dengan nilai tertinggi. Ini sama dengan TM(:99%).

  • Rata-rata Terpangkas, Hitungan Terpangkas, Jumlah Terpangkas, dan Rata-rata Terpotong semuanya dapat disingkat menggunakan huruf besar saat menentukan rentang, seperti TM(5%:95%), TM(100:200), atau TM(:95%). Anda hanya dapat menyingkat menggunakan huruf kecil ketika menentukan satu angka saja, seperti tm99.

Kasus penggunaan statistik

  • Rata-rata terpangkas paling berguna untuk metrik dengan ukuran sampel yang besar, seperti latensi halaman web. Sebagai contoh, tm99 mengabaikan pencilan yang sangat ekstrem yang mungkin disebabkan masalah jaringan atau kesalahan manusia, yang akan memberikan angka yang lebih akurat untuk latensi rata-rata permintaan khusus. Demikian pula, TM(10%:) mengabaikan 10% nilai latensi terendah, seperti yang dihasilkan dari klik cache. Dan TM(10%:99%) tidak termasuk kedua jenis pencilan ini. Kami menyarankan agar Anda menggunakan rata-rata terpangkas untuk memantau latensi.

  • Sebaiknya perhatikan hitungan terpangkas setiap kali Anda menggunakan rata-rata terpangkas, untuk memastikan bahwa jumlah nilai yang digunakan dalam penghitungan rata-rata terpangkas cukup untuk secara statistik menjadi signifikan.

  • Peringkat persentil memungkinkan Anda memasukkan nilai ke dalam "tempat sampah" rentang, dan Anda dapat menggunakannya untuk membuat histogram secara manual. Untuk melakukan ini, pisahkan nilai Anda menjadi berbagai tempat sampah, seperti PR(:1), PR(1:5), PR(5:10), dan PR(10:). Masukkan masing-masing tempat sampah ini ke dalam visualisasi sebagai diagram batang, dan Anda memiliki histogram.

    Peringkat persentil eksklusif pada batas bawah dan inklusif di batas atas.

Persentil versus rata-rata terpangkas

Persentil seperti p99 dan rata-rata terpangkas seperti tm99 mengukur nilai yang serupa, tetapi tidak identik. Baik p99 dan tm99 mengabaikan 1% titik data dengan nilai tertinggi, yang dianggap pencilan. Setelah itu, p99 adalah nilai maksimum dari 99% sisanya, sedangkan tm99 adalah rata-rata dari 99% sisanya. Jika Anda melihat latensi permintaan web, p99 memberi tahu Anda pengalaman pelanggan terburuk, mengabaikan pencilan, sementara tm99 memberi tahu Anda pengalaman pelanggan rata-rata, mengabaikan pencilan.

Rata-rata terpangkas adalah statistik latensi yang baik untuk dilihat jika Anda ingin mengoptimalkan pengalaman pelanggan Anda.

Persyaratan menggunakan persentil, rata-rata terpangkas, dan beberapa statistik lainnya

CloudWatch membutuhkan poin data mentah untuk menghitung statistik berikut:

  • Persentil

  • Rata-rata terpangkas

  • Interquartile mean

  • Winsorized mean

  • Trimmed sum

  • Trimmed count

  • Peringkat persentil

Jika menerbitkan data untuk statistik kustom menggunakan himpunan statistik, alih-alih data mentah, Anda dapat mengambil jenis statistik ini untuk data ini hanya jika salah satu kondisi berikut benar:

  • SampleCount Nilai himpunan statistik adalah 1 dan Min, Max, dan Jumlah semuanya sama.

  • Min dan Max sama, dan Jumlah sama dengan Min dikalikan dengan. SampleCount

AWS Layanan berikut mencakup metrik yang mendukung jenis statistik ini.

  • APIGerbang

  • Penyeimbang Beban Aplikasi

  • Amazon EC2

  • Penyeimbang Beban Elastis

  • Kinesis

  • Amazon RDS

Selain itu, jenis statistik ini tidak tersedia untuk metrik jika nilai metrik merupakan angka negatif.