Lampiran 1 - Metrik kritis MTTD dan MTTR - Ketersediaan dan Selanjutnya: Memahami dan Meningkatkan Ketahanan Sistem Terdistribusi AWS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Lampiran 1 - Metrik kritis MTTD dan MTTR

Berikut ini adalah kerangka kerja untuk standardisasi dalam instrumentasi dan observability yang dapat membantu mengurangi MTTD dan MTTR selama suatu acara.

Metrik Pengalaman Pelanggan. Metrik ini mencerminkan bahwa layanan responsif dan tersedia untuk melayani permintaan pelanggan. Misalnya, latensi bidang kontrol. Metrik ini mengukur tingkat kesalahan, ketersediaan, latensi, volume, dan laju throttle.

Metrik Penilaian Dampak. Metrik ini memberikan wawasan tentang ruang lingkup dampak selama peristiwa. Misalnya, jumlah atau persentase pelanggan yang terkena dampak peristiwa bidang data. Mengukur jumlah atau persentase hal yang terkena dampak.

Metrik Kesehatan Operasional. Metrik ini mencerminkan bahwa layanan responsif dan tersedia untuk melayani permintaan pelanggan, tetapi berfokus pada subsistem infrastruktur umum dan sumber daya. Misalnya, persentase pemanfaatan CPU armada EC2 Anda. Metrik ini harus mengukur pemanfaatan, kapasitas, throughput, tingkat kesalahan, ketersediaan, dan latensi.