Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kebijakan Auto Scaling
Kebijakan penskalaan memiliki komponen berikut:
-
Metrik target — CloudWatch Metrik yang digunakan ElastiCache untuk Valkey dan Redis OSS Auto Scaling untuk menentukan kapan dan berapa banyak skala.
-
Kapasitas minimum dan maksimum – Jumlah serpihan atau replika minimum dan maksimum yang digunakan untuk penskalaan.
penting
Saat membuat kebijakan penskalaan Otomatis, jika kapasitas saat ini lebih tinggi dari kapasitas maksimal yang dikonfigurasi, kami scaleIn akan melakukan MaxCapacity selama pembuatan kebijakan. Demikian pula jika kapasitas saat ini lebih rendah dari kapasitas min yang dikonfigurasi, kita scaleOut ke MinCapacity.
-
Periode pendinginan – Jumlah waktu, dalam detik, setelah aktivitas penskalaan ke dalam atau penskalaan ke luar selesai sebelum aktivitas penskalaan ke luar lainnya dapat dimulai.
-
Peran terkait layanan — Peran AWS Identity and Access Management (IAM) yang ditautkan ke layanan tertentu AWS . Peran terkait layanan mencakup semua izin yang diperlukan layanan untuk memanggil AWS layanan lain atas nama Anda. ElastiCache Auto Scaling secara otomatis menghasilkan peran ini,
AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG
, untuk Anda. -
Aktifkan atau nonaktifkan aktivitas penskalaan ke dalam - Kemampuan untuk mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam untuk suatu kebijakan.
Topik
Metrik target untuk Auto Scaling
Dalam jenis kebijakan ini, metrik yang telah ditentukan atau kustom dan nilai target untuk metrik ditentukan dalam konfigurasi kebijakan penskalaan pelacakan target. ElastiCache untuk Valkey dan Redis Auto OSS Scaling membuat dan CloudWatch mengelola alarm yang memicu kebijakan penskalaan dan menghitung penyesuaian penskalaan berdasarkan metrik dan nilai target. Kebijakan penskalaan menambah atau menghapus shards/replicas as required to keep the metric at, or close to, the specified target value. In addition to keeping the metric close to the target value, a target-tracking scaling policy also adjusts to fluctuations in the metric due to a changing workload. Such a policy also minimizes rapid fluctuations in the number of available shards/replicas klaster Anda.
Misalnya, pertimbangkan kebijakan penskalaan yang menggunakan metrik ElastiCachePrimaryEngineCPUUtilization
rata-rata standar. Kebijakan semacam itu dapat menjaga CPU pemanfaatan pada, atau mendekati, persentase pemanfaatan tertentu, seperti 70 persen.
catatan
Untuk setiap klaster, Anda hanya dapat membuat satu kebijakan Auto Scaling untuk setiap metrik target.
Kapasitas minimum dan maksimum
Serpihan
Anda dapat menentukan jumlah pecahan maksimum yang dapat diskalakan untuk penskalaan otomatis ElastiCache Valkey dan Redis. OSS Nilai ini harus kurang dari atau sama dengan 250 dengan minimum 1. Anda juga dapat menentukan jumlah minimum pecahan yang akan dikelola dengan penskalaan otomatis. Nilai ini harus minimal 1, dan sama dengan atau kurang dari nilai yang ditentukan untuk serpihan maksimum yaitu 250.
Replika
Anda dapat menentukan jumlah maksimum replika yang akan dikelola oleh ElastiCache untuk penskalaan OSS otomatis Valkey dan Redis. Nilai ini harus kurang dari atau sama dengan 5. Anda juga dapat menentukan jumlah minimum replika yang akan dikelola dengan penskalaan otomatis. Nilai ini harus minimal 1, dan sama dengan atau kurang dari nilai yang ditentukan untuk replika maksimum yaitu 5.
Untuk menentukan jumlah minimum dan maksimum serpihan/replika yang Anda perlukan untuk lalu lintas biasa, uji konfigurasi Auto Scaling Anda dengan tingkat lalu lintas yang diharapkan untuk model Anda.
catatan
ElastiCache Kebijakan penskalaan otomatis meningkatkan kapasitas klaster hingga mencapai ukuran maksimum yang Anda tentukan atau hingga batas layanan berlaku. Untuk meminta penambahan batas, lihat Batas Layanan AWS dan pilih jenis batas Simpul per klaster per jenis instans.
penting
Penskalaan ke dalam terjadi ketika tidak ada lalu lintas. Jika lalu lintas varian menjadi nol, ElastiCache secara otomatis menskalakan ke jumlah minimum instance yang ditentukan.
Periode pendinginan
Anda dapat menyesuaikan daya respons kebijakan penskalaan pelacakan target dengan menambahkan periode pendinginan yang memengaruhi penskalaan klaster Anda. Periode pendinginan memblokir permintaan penskalaan ke dalam atau ke luar berikutnya hingga periode ini berakhir. Ini memperlambat penghapusan untuk permintaan scale-outshards/replicas in your ElastiCache for Valkey and Redis OSS cluster for scale-in requests, and the creation of shards/replicas. Anda dapat menentukan periode pendinginan berikut:
-
Aktivitas scale-in mengurangi jumlah pecahan/replika di klaster Anda. Periode pendinginan penskalaan ke dalam menentukan jumlah waktu, dalam detik, setelah aktivitas penskalaan ke dalam selesai sebelum aktivitas penskalaan ke dalam lainnya dapat dimulai.
-
Aktivitas scale-out meningkatkan jumlah shard/replika di cluster Anda. Periode pendinginan penskalaan ke luar menentukan jumlah waktu, dalam detik, setelah aktivitas penskalaan ke luar selesai sebelum aktivitas penskalaan ke luar lainnya dapat dimulai.
Ketika periode pendinginan penskalaan ke dalam atau penskalaan ke luar tidak ditentukan, nilai default untuk penskalaan ke luar adalah 600 detik dan untuk penskalaan ke dalam adalah 900 detik.
Mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam
Anda dapat mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam untuk sebuah kebijakan. Mengaktifkan aktivitas scale-in memungkinkan kebijakan penskalaan dihapus. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas
catatan
Aktivitas scale-out selalu diaktifkan sehingga kebijakan penskalaan dapat membuat ElastiCache pecahan atau replika sesuai kebutuhan.