Prinsip desain - AWS Well-Architected Framework

Prinsip desain

Terdapat lima prinsip desain untuk keandalan di cloud:

  • Pulihkan secara otomatis dari kegagalan: Dengan memantau beban kerja untuk indikator kinerja utama (KPI), Anda dapat memicu otomatisasi ketika ambang batas dilanggar. KPI ini harus menjadi ukuran dari nilai bisnis, bukan menjadi ukuran aspek teknis operasi layanan. Hal ini memungkinkan notifikasi otomatis dan pelacakan kegagalan, serta proses pemulihan otomatis yang menangani atau memperbaiki kegagalan. Dengan otomatisasi yang lebih canggih, antisipasi dan perbaikan kegagalan dapat dilakukan sebelum kegagalan terjadi.

  • Uji prosedur pemulihan: Dalam lingkungan on-premise, pengujian biasanya dijalankan untuk membuktikan bahwa beban kerja bekerja dalam skenario tertentu. Pengujian tidak digunakan untuk memvalidasi strategi pemulihan. Di cloud, Anda dapat menguji bagaimana beban kerja gagal, dan dapat memvalidasi prosedur pemulihan. Gunakan otomatisasi untuk memicu berbagai kegagalan atau untuk membuat ulang skenario yang mengarah pada kegagalan sebelumnya. Pendekatan ini memperlihatkan jalur kegagalan yang dapat diuji dan diperbaiki sebelum skenario kegagalan benar-benar terjadi, dan juga mengurangi risiko.

  • Skalakan secara horizontal untuk meningkatkan ketersediaan beban kerja agregat: Ganti satu sumber daya besar dengan beberapa sumber daya kecil untuk mengurangi dampak kegagalan tunggal terhadap beban kerja keseluruhan. Distribusikan permintaan ke beberapa sumber daya yang lebih kecil untuk memastikan tidak adanya kesamaan titik kegagalan.

  • Jangan menebak kapasitas: Penyebab umum kegagalan dalam beban kerja on-premise adalah saturasi sumber daya, yaitu ketika permintaan yang ditempatkan di beban kerja melebihi kapasitas beban kerjanya (ini sering kali menjadi sasaran dari serangan denial of service). Di cloud, Anda dapat memantau pemanfaatan beban kerja dan permintaan, serta mengotomatiskan penambahan atau penghapusan sumber daya untuk mempertahankan tingkat keoptimalan guna memenuhi permintaan tanpa kekurangan atau kelebihan penyediaan. Batasan tentunya masih ada, tetapi sebagian kuota dapat dikontrol dan sebagian lainnya dapat dikelola (lihat Mengelola Service Quotas dan Pembatasan).

  • Kelola perubahan dalam otomatisasi: Perubahan untuk infrastruktur Anda harus dibuat menggunakan otomatisasi. Perubahan yang harus dikelola mencakup perubahan untuk otomatisasi, yang kemudian dapat dilacak dan ditinjau.