Merancang sistem terdistribusi yang sangat tersedia AWS - Ketersediaan dan Selanjutnya: Memahami dan Meningkatkan Ketahanan Sistem Terdistribusi AWS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Merancang sistem terdistribusi yang sangat tersedia AWS

Bagian sebelumnya sebagian besar tentang ketersediaan teoritis beban kerja dan apa yang dapat mereka capai. Mereka adalah seperangkat konsep penting yang perlu diingat saat Anda membangun sistem terdistribusi. Mereka akan membantu menginformasikan proses pemilihan dependensi Anda dan bagaimana Anda menerapkan redundansi.

Kami juga telah melihat hubungan MTTD, MTTR, dan MTBF dengan ketersediaan. Bagian ini akan memperkenalkan panduan praktis berdasarkan teori sebelumnya. Singkatnya, beban kerja teknik untuk ketersediaan tinggi bertujuan untuk meningkatkan MTBF dan mengurangi MTTR serta MTTD.

Meskipun menghilangkan semua kegagalan akan ideal, itu tidak realistis. Dalam sistem terdistribusi besar dengan dependensi yang sangat ditumpuk, kegagalan akan terjadi. “Semuanya gagal sepanjang waktu” (lihat Werner Vogels, CTO, Amazon.com, 10 Pelajaran dari 10 Tahun Amazon Web Services.) dan “Anda tidak dapat membuat undang-undang terhadap kegagalan [jadi] fokus pada deteksi dan respons cepat.” (lihat Chris Pinkham, anggota pendiri, tim Amazon EC2, ARC335 Merancang untuk kegagalan: Merancang sistem tangguh aktif) AWS

Apa artinya ini adalah bahwa sering Anda tidak memiliki kontrol atas apakah kegagalan terjadi. Apa yang dapat Anda kontrol adalah seberapa cepat Anda mendeteksi kegagalan dan melakukan sesuatu tentang hal itu. Jadi, sementara peningkatan MTBF masih merupakan komponen penting dari ketersediaan tinggi, perubahan paling signifikan yang dimiliki pelanggan dalam kendali mereka adalah mengurangi MTTD dan MTTR.