Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kebijakan Auto Scaling
Kebijakan penskalaan memiliki komponen berikut:
-
Metrik target — CloudWatch Metrik yang digunakan ElastiCache untuk Valkey dan Redis OSS Auto Scaling untuk menentukan kapan dan berapa banyak skala.
-
Kapasitas minimum dan maksimum – Jumlah serpihan atau replika minimum dan maksimum yang digunakan untuk penskalaan.
penting
Saat membuat kebijakan penskalaan Otomatis, jika kapasitas saat ini lebih tinggi dari kapasitas maksimal yang dikonfigurasi, kami menskaleIn MaxCapacity selama pembuatan kebijakan. Demikian pula jika kapasitas saat ini lebih rendah dari kapasitas min yang dikonfigurasi, kami ScaleOut ke. MinCapacity
-
Periode pendinginan – Jumlah waktu, dalam detik, setelah aktivitas penskalaan ke dalam atau penskalaan ke luar selesai sebelum aktivitas penskalaan ke luar lainnya dapat dimulai.
-
Peran terkait layanan — Peran AWS Identitas dan Manajemen Akses (IAM) and Access Management (IAM) yang ditautkan ke layanan tertentu. AWS Peran terkait layanan mencakup semua izin yang diperlukan layanan untuk memanggil AWS layanan lain atas nama Anda. ElastiCache Auto Scaling secara otomatis menghasilkan peran ini,
AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG
, untuk Anda. -
Aktifkan atau nonaktifkan aktivitas penskalaan ke dalam - Kemampuan untuk mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam untuk suatu kebijakan.
Topik
Metrik target untuk Auto Scaling
Dalam jenis kebijakan ini, metrik yang telah ditentukan atau kustom dan nilai target untuk metrik ditentukan dalam konfigurasi kebijakan penskalaan pelacakan target. ElastiCache untuk Valkey dan Redis OSS Auto Scaling membuat dan mengelola CloudWatch alarm yang memicu kebijakan penskalaan dan menghitung penyesuaian penskalaan berdasarkan metrik dan nilai target. Kebijakan penskalaan menambahkan atau menghapus shards/replicas sesuai kebutuhan untuk menjaga metrik pada, atau mendekati, nilai target yang ditentukan. Selain menjaga metrik tetap dekat dengan nilai target, kebijakan penskalaan pelacakan target juga disesuaikan menurut fluktuasi metrik karena pola beban kerja yang berubah. Kebijakan semacam itu juga meminimalkan fluktuasi cepat dalam jumlah yang tersedia shards/replicas untuk klaster Anda.
Misalnya, pertimbangkan kebijakan penskalaan yang menggunakan metrik ElastiCachePrimaryEngineCPUUtilization
rata-rata standar. Kebijakan tersebut dapat menjaga pemanfaatan CPU pada, atau mendekati, persentase pemanfaatan tertentu, seperti 70 persen.
catatan
Untuk setiap klaster, Anda hanya dapat membuat satu kebijakan Auto Scaling untuk setiap metrik target.
Kapasitas minimum dan maksimum
Serpihan
Anda dapat menentukan jumlah pecahan maksimum yang dapat diskalakan oleh ElastiCache untuk penskalaan otomatis Valkey dan Redis OSS. Nilai ini harus kurang dari atau sama dengan 250 dengan minimum 1. Anda juga dapat menentukan jumlah minimum pecahan yang akan dikelola dengan penskalaan otomatis. Nilai ini harus minimal 1, dan sama dengan atau kurang dari nilai yang ditentukan untuk serpihan maksimum yaitu 250.
Replika
Anda dapat menentukan jumlah maksimum replika yang akan dikelola oleh ElastiCache untuk penskalaan otomatis Valkey dan Redis OSS. Nilai ini harus kurang dari atau sama dengan 5. Anda juga dapat menentukan jumlah minimum replika yang akan dikelola dengan penskalaan otomatis. Nilai ini harus minimal 1, dan sama dengan atau kurang dari nilai yang ditentukan untuk replika maksimum yaitu 5.
Untuk menentukan jumlah minimum dan maksimum shards/replicas yang Anda butuhkan untuk lalu lintas tipikal, uji konfigurasi Auto Scaling Anda dengan tingkat lalu lintas yang diharapkan ke model Anda.
catatan
ElastiCache Kebijakan penskalaan otomatis meningkatkan kapasitas klaster hingga mencapai ukuran maksimum yang Anda tentukan atau hingga batas layanan berlaku. Untuk meminta penambahan batas, lihat Batas Layanan AWS dan pilih jenis batas Simpul per klaster per jenis instans.
penting
Penskalaan ke dalam terjadi ketika tidak ada lalu lintas. Jika lalu lintas varian menjadi nol, ElastiCache secara otomatis menskalakan ke jumlah minimum instance yang ditentukan.
Periode pendinginan
Anda dapat menyesuaikan daya respons kebijakan penskalaan pelacakan target dengan menambahkan periode pendinginan yang memengaruhi penskalaan klaster Anda. Periode pendinginan memblokir permintaan penskalaan ke dalam atau ke luar berikutnya hingga periode ini berakhir. Ini memperlambat penghapusan di cluster Valkey dan Redis OSS Anda ElastiCache untuk permintaan scale-in, dan pembuatan untuk permintaan scale-out. shards/replicas shards/replicas Anda dapat menentukan periode pendinginan berikut:
-
Aktivitas scale-in mengurangi jumlah di klaster shards/replicas Anda. Periode pendinginan penskalaan ke dalam menentukan jumlah waktu, dalam detik, setelah aktivitas penskalaan ke dalam selesai sebelum aktivitas penskalaan ke dalam lainnya dapat dimulai.
-
Aktivitas scale-out meningkatkan jumlah di klaster shards/replicas Anda. Periode pendinginan penskalaan ke luar menentukan jumlah waktu, dalam detik, setelah aktivitas penskalaan ke luar selesai sebelum aktivitas penskalaan ke luar lainnya dapat dimulai.
Ketika periode pendinginan penskalaan ke dalam atau penskalaan ke luar tidak ditentukan, nilai default untuk penskalaan ke luar adalah 600 detik dan untuk penskalaan ke dalam adalah 900 detik.
Mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam
Anda dapat mengaktifkan atau menonaktifkan aktivitas penskalaan ke dalam untuk sebuah kebijakan. Mengaktifkan aktivitas scale-in memungkinkan kebijakan penskalaan dihapus. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas
catatan
Aktivitas scale-out selalu diaktifkan sehingga kebijakan penskalaan dapat membuat ElastiCache pecahan atau replika sesuai kebutuhan.