Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Praktik terbaik umum
Praktik terbaik berikut membantu Anda mendapatkan visibilitas yang cukup terhadap kesehatan beban kerja Amazon RDS Anda dan mengambil tindakan yang sesuai sebagai respons terhadap peristiwa operasional dan data pemantauan.
-
Identifikasi KPI.Identifikasi indikator kinerja utama (KPI) berdasarkan hasil bisnis yang diinginkan. Evaluasi KPI untuk menentukan keberhasilan beban kerja. Misalnya, jika bisnis inti Anda adalah e-commerce, salah satu hasil bisnis yang Anda inginkan adalah bahwa e-shop Anda tersedia 24/7 bagi pelanggan Anda untuk berbelanja. Untuk mencapai hasil bisnis tersebut, Anda menentukan KPI ketersediaan untuk database Amazon RDS backend yang digunakan aplikasi e-shop Anda, dan menetapkan KPI dasar menjadi 99,99% setiap minggu. Mengevaluasi ketersediaan aktual KPI terhadap nilai dasar membantu Anda menentukan apakah Anda memenuhi ketersediaan database yang diinginkan 99,99% dan dengan demikian mencapai hasil bisnis memiliki layanan 24/7.
-
Tentukan metrik beban kerja.Tentukan metrik beban kerja untuk mengukur jumlah dan kualitas beban kerja Amazon RDS Anda. Evaluasi metrik untuk menentukan apakah beban kerja mencapai hasil yang diinginkan, dan untuk memahami kesehatan beban kerja. Misalnya, untuk mengevaluasi KPI ketersediaan untuk instans DB Amazon RDS Anda, Anda harus mengukur metrik seperti waktu aktif dan waktu henti untuk instans DB. Anda kemudian dapat menggunakan metrik tersebut untuk menghitung ketersediaan KPI sebagai berikut:
availability = uptime / (uptime + downtime)
Metrik mewakili kumpulan titik data yang dipesan waktu. Metrik juga dapat mencakup dimensi, yang berguna dalam kategorisasi dan analisis.
-
Kumpulkan dan analisis metrik beban kerja.Amazon RDS menghasilkan metrik dan log yang berbeda, tergantung pada konfigurasi Anda. Beberapa ini mewakili DB misalnya peristiwa, counter, atau statistik seperti
db.Cache.innoDB_buffer_pool_hits
. Metrik lain berasal dari sistem operasi, sepertimemory.Total
, yang mengukur jumlah total memori instans Amazon Elastic Compute Cloud (Amazon EC2) host. Alat pemantauan harus melakukan analisis reguler dan proaktif terhadap metrik yang dikumpulkan untuk mengidentifikasi tren dan menentukan apakah ada respons yang sesuai diperlukan. -
Tetapkan baseline metrik beban kerja.Tetapkan garis dasar untuk metrik untuk menentukan nilai yang diharapkan dan untuk mengidentifikasi ambang batas yang baik atau buruk. Misalnya, Anda mungkin menentukan baseline untuk
ReadIOPS
hingga 1.000 di bawah operasi database normal. Anda kemudian dapat menggunakan baseline ini untuk perbandingan dan untuk mengidentifikasi over-utilization. Jika metrik baru Anda secara konsisten menunjukkan bahwa IOPS baca berada dalam kisaran 2.000-3.000, Anda telah mengidentifikasi penyimpangan yang dapat memicu respons untuk penyelidikan, intervensi, dan peningkatan. -
Waspada saat hasil beban kerja berisiko.Ketika Anda menentukan bahwa hasil bisnis berisiko, naikkan peringatan. Anda kemudian dapat mengatasi masalah secara proaktif, sebelum memengaruhi pelanggan Anda, atau mengurangi dampak insiden secara tepat waktu.
-
Identifikasi pola aktivitas yang diharapkan untuk beban kerja Anda.Berdasarkan garis dasar metrik Anda, tetapkan pola aktivitas beban kerja untuk mengidentifikasi perilaku tak terduga dan merespons dengan tindakan yang sesuai jika perlu.AWSmemberialat pemantauanyang menerapkan algoritma statistik dan pembelajaran mesin untuk menganalisis metrik dan mendeteksi anomali.
-
Peringatan saat anomali beban kerja terdeteksi.Ketika anomali terdeteksi dalam operasi beban kerja Amazon RDS, naikkan peringatan sehingga Anda dapat merespons dengan tindakan yang sesuai jika perlu.
-
Tinjau dan revisi KPI dan metrik. Konfirmasikan bahwa basis data Amazon RDS Anda memenuhi persyaratan yang ditentukan dan identifikasi area potensi peningkatan untuk mencapai tujuan bisnis Anda. Validasi efektivitas metrik yang diukur dan KPI yang dievaluasi, dan revisi jika perlu. Misalnya, Anda menetapkan KPI untuk jumlah optimal koneksi database bersamaan, dan Anda memantau metrik mengenai koneksi yang dicoba dan gagal serta utas pengguna yang dibuat dan sedang berjalan. Anda mungkin memiliki lebih banyak koneksi database daripada yang ditentukan oleh baseline KPI Anda. Dengan menganalisis metrik Anda saat ini, Anda dapat mendeteksi hasilnya tetapi Anda mungkin tidak dapat menentukan akar penyebabnya. Jika demikian, Anda harus merevisi metrik Anda dan menyertakan langkah-langkah pemantauan tambahan, seperti penghitung untuk kunci meja. Metrik baru akan membantu menentukan apakah peningkatan jumlah koneksi database disebabkan oleh kunci tabel yang tidak terduga.