AWS Resilience Hub konsep - AWS Hub Ketahanan

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS Resilience Hub konsep

Konsep-konsep ini dapat membantu Anda lebih memahami pendekatan untuk membantu meningkatkan ketahanan aplikasi dan mencegah pemadaman aplikasi. AWS Resilience Hub

Ketahanan

Kemampuan untuk menjaga ketersediaan dan memulihkan dari perangkat lunak dan gangguan operasional dalam kerangka waktu yang ditentukan.

Tujuan titik pemulihan (RPO)

Jumlah waktu maksimum yang dapat diterima sejak titik pemulihan data terakhir. Ini menentukan apa yang dianggap sebagai kehilangan data yang dapat diterima antara titik pemulihan terakhir dan gangguan layanan.

Tujuan waktu pemulihan (RTO)

Penundaan maksimum yang dapat diterima antara gangguan layanan dan pemulihan layanan. Ini menentukan apa yang dianggap sebagai jendela waktu yang dapat diterima ketika layanan tidak tersedia.

Perkiraan tujuan waktu pemulihan beban kerja

Perkiraan tujuan waktu pemulihan beban kerja (estimasi beban kerjaRTO) adalah RTO bahwa aplikasi Anda diperkirakan memenuhi berdasarkan definisi aplikasi yang diimpor dan kemudian menjalankan penilaian.

Perkiraan tujuan titik pemulihan beban kerja

Estimasi tujuan titik pemulihan beban kerja (estimasi beban kerjaRPO) adalah RPO bahwa aplikasi Anda diperkirakan memenuhi berdasarkan definisi aplikasi yang diimpor dan kemudian menjalankan penilaian.

Aplikasi

AWS Resilience Hub Aplikasi adalah kumpulan sumber daya yang AWS didukung yang terus dipantau dan dinilai untuk mengelola postur ketahanannya.

Komponen Aplikasi

Sekelompok AWS sumber daya terkait yang bekerja dan gagal sebagai satu kesatuan. Misalnya, jika Anda memiliki basis data primer dan replika, maka kedua database milik Komponen Aplikasi yang sama ()AppComponent.

AWS Resilience Hub menentukan AWS sumber daya mana yang dapat dimiliki oleh jenis AppComponent. Misalnya, DBInstance bisa menjadi milik AWS::ResilienceHub::DatabaseAppComponent tetapi bukan milikAWS::ResilienceHub::ComputeAppComponent.

Status kepatuhan aplikasi

AWS Resilience Hub melaporkan jenis status kepatuhan berikut untuk aplikasi Anda.

Kebijakan terpenuhi

Aplikasi ini diperkirakan memenuhi RTO dan RPO target yang ditentukan dalam kebijakan. Semua komponennya memenuhi tujuan kebijakan yang ditetapkan. Misalnya, Anda memilih RTO dan RPO target 24 jam untuk gangguan di seluruh AWS Wilayah. AWS Resilience Hub dapat melihat bahwa cadangan Anda disalin ke Wilayah fallback Anda. Anda masih diharapkan untuk mempertahankan pemulihan dari prosedur operasi standar cadangan (SOP), dan untuk menguji dan mengatur waktu itu. Ini ada dalam rekomendasi operasional dan bagian dari skor ketahanan Anda secara keseluruhan.

Kebijakan dilanggar

Aplikasi tidak dapat diperkirakan memenuhi RTO dan RPO target yang ditentukan dalam kebijakan. Satu atau lebih dari itu AppComponents tidak memenuhi tujuan kebijakan. Misalnya, Anda memilih RTO dan RPO target 24 jam untuk gangguan di seluruh AWS Wilayah, tetapi konfigurasi database Anda tidak menyertakan metode pemulihan Lintas wilayah apa pun, seperti replikasi global dan salinan cadangan.

Tidak dinilai

Aplikasi ini membutuhkan penilaian. Saat ini tidak dinilai atau dilacak.

Perubahan terdeteksi

Ada versi aplikasi baru yang diterbitkan yang belum dinilai.

Deteksi penyimpangan

AWS Resilience Hub menjalankan pemberitahuan drift saat menjalankan penilaian untuk aplikasi Anda untuk memeriksa apakah perubahan AppComponent konfigurasi telah memengaruhi status kepatuhan aplikasi Anda. Selain itu, ia juga memeriksa dan mendeteksi perubahan seperti penambahan atau penghapusan sumber daya dalam sumber input aplikasi dan memberi tahu tentang hal yang sama. Sebagai perbandingan, AWS Resilience Hub gunakan penilaian sebelumnya di mana komponen aplikasi memenuhi kebijakan. AWS Resilience Hub mendeteksi jenis drift berikut:

  • Pergeseran kebijakan aplikasi — Jenis drift ini mengidentifikasi semua AppComponents yang sesuai dengan kebijakan dalam penilaian sebelumnya tetapi gagal mematuhi penilaian saat ini.

  • Application resource drift — Jenis drift ini mengidentifikasi semua resource drifted dalam versi aplikasi saat ini.

Penilaian ketahanan

AWS Resilience Hub menggunakan daftar kesenjangan dan solusi potensial untuk mengukur efektivitas kebijakan yang dipilih untuk memulihkan dan melanjutkan dari bencana. Ini mengevaluasi setiap Komponen Aplikasi atau status kepatuhan aplikasi dengan kebijakan. Laporan ini mencakup rekomendasi pengoptimalan biaya dan referensi untuk masalah potensial.

Skor ketahanan

AWS Resilience Hub menghasilkan skor yang menunjukkan seberapa dekat aplikasi Anda mengikuti rekomendasi kami untuk memenuhi kebijakan ketahanan aplikasi, alarm, prosedur operasi standar (SOPs), dan pengujian.

Jenis gangguan

AWS Resilience Hub membantu Anda menilai ketahanan terhadap jenis pemadaman berikut:

Aplikasi

Infrastrukturnya sehat, tetapi tumpukan aplikasi atau perangkat lunak tidak beroperasi sesuai kebutuhan. Hal ini dapat terjadi setelah penerapan kode baru, perubahan konfigurasi, kerusakan data, atau kerusakan dependensi hilir.

Infrastruktur Cloud

Infrastruktur cloud tidak berfungsi seperti yang diharapkan karena pemadaman. Pemadaman dapat terjadi karena kesalahan lokal pada satu atau lebih komponen. Dalam kebanyakan kasus, jenis pemadaman ini diselesaikan dengan me-reboot, mendaur ulang, atau memuat ulang komponen yang salah.

Gangguan AZ Infrastruktur Cloud

Satu atau beberapa Availability Zone tidak tersedia. Jenis pemadaman ini dapat diatasi dengan beralih ke Availability Zone yang berbeda.

Insiden Wilayah Infrastruktur Cloud

Satu atau lebih Wilayah tidak tersedia. Jenis insiden ini dapat diselesaikan dengan beralih ke yang berbeda Wilayah AWS.

Eksperimen injeksi kesalahan

AWS Resilience Hub merekomendasikan tes untuk memverifikasi ketahanan aplikasi terhadap berbagai jenis pemadaman. Pemadaman ini termasuk aplikasi, infrastruktur, Availability Zones (AZ), atau Wilayah AWS insiden Komponen Aplikasi.

Eksperimen ini memungkinkan Anda melakukan hal berikut:

  • Menyuntikkan kegagalan.

  • Verifikasi bahwa alarm dapat mendeteksi pemadaman.

  • Verifikasi bahwa prosedur pemulihan, atau prosedur operasi standar (SOPs), berfungsi dengan benar untuk memulihkan aplikasi dari pemadaman.

Pengujian untuk SOPs mengukur perkiraan beban kerja RTO dan perkiraan beban kerjaRPO. Anda dapat menguji konfigurasi aplikasi yang berbeda dan mengukur apakah output RTO dan RPO memenuhi tujuan yang ditentukan dalam kebijakan Anda.

SOP

Prosedur operasi standar (SOP) adalah serangkaian langkah preskriptif yang dirancang untuk memulihkan aplikasi Anda secara efisien jika terjadi pemadaman atau alarm. Berdasarkan penilaian aplikasi, AWS Resilience Hub rekomendasikan satu set SOPs dan disarankan untuk menyiapkan, menguji, dan mengukur SOPs terlebih dahulu gangguan untuk memastikan pemulihan tepat waktu.