Konsep Application Auto Scaling - Application Auto Scaling

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konsep Application Auto Scaling

Topik ini menjelaskan konsep-konsep kunci untuk membantu Anda mempelajari Application Auto Scaling dan mulai menggunakannya.

Target yang dapat diskalakan

Entitas yang Anda buat untuk menentukan sumber daya yang ingin Anda skalakan. Setiap target yang dapat diskalakan diidentifikasi secara unik oleh namespace layanan, ID sumber daya, dan dimensi yang dapat diskalakan, yang mewakili beberapa dimensi kapasitas layanan yang mendasarinya. Misalnya, layanan Amazon ECS mendukung penskalaan otomatis jumlah tugasnya, tabel DynamoDB mendukung penskalaan otomatis kapasitas baca dan tulis tabel dan indeks sekunder globalnya, dan klaster Aurora mendukung penskalaan jumlah replika.

Tip

Setiap target yang dapat diskalakan juga memiliki kapasitas minimum dan maksimum. Kebijakan penskalaan tidak akan pernah lebih tinggi atau lebih rendah dari kisaran minimum-maksimum. Anda dapat membuat out-of-band perubahan langsung ke sumber daya dasar yang berada di luar rentang ini, yang tidak diketahui Application Auto Scaling. Namun, kapan saja kebijakan penskalaan dipanggil atau RegisterScalableTarget API dipanggil, Application Auto Scaling mengambil kapasitas saat ini dan membandingkannya dengan kapasitas minimum dan maksimum. Jika berada di luar kisaran minimum-maksimum, maka kapasitas diperbarui untuk memenuhi minimum dan maksimum yang ditetapkan.

Penurunan skala

Ketika Application Auto Scaling secara otomatis mengurangi kapasitas untuk target yang dapat diskalakan, target yang dapat diskalakan akan masuk. Ketika kebijakan penskalaan ditetapkan, mereka tidak dapat menskalakan target yang dapat diskalakan lebih rendah dari kapasitas minimumnya.

Menskalakan ke luar

Ketika Application Auto Scaling secara otomatis meningkatkan kapasitas untuk target yang dapat diskalakan, target yang dapat diskalakan akan keluar. Ketika kebijakan penskalaan ditetapkan, mereka tidak dapat mengukur target yang dapat diskalakan lebih tinggi dari kapasitas maksimumnya.

Kebijakan penskalaan

Kebijakan penskalaan menginstruksikan Application Auto Scaling untuk melacak metrik tertentu. CloudWatch Kemudian, ini menentukan tindakan penskalaan apa yang harus diambil ketika metrik lebih tinggi atau lebih rendah dari nilai ambang tertentu. Misalnya, Anda mungkin ingin memperkecil skala jika penggunaan CPU di seluruh klaster Anda mulai meningkat, dan menskalakan saat CPU turun lagi.

Metrik yang digunakan untuk penskalaan otomatis diterbitkan oleh layanan target, tetapi Anda juga dapat mempublikasikan metrik Anda sendiri CloudWatch dan kemudian menggunakannya dengan kebijakan penskalaan.

Periode cooldown antara aktivitas penskalaan memungkinkan sumber daya stabil sebelum aktivitas penskalaan lainnya dimulai. Application Auto Scaling terus mengevaluasi metrik selama periode cooldown. Ketika periode cooldown berakhir, kebijakan penskalaan memulai aktivitas penskalaan lain jika diperlukan. Sementara periode cooldown berlaku, jika skala yang lebih besar diperlukan berdasarkan nilai metrik saat ini, kebijakan penskalaan segera keluar.

Tindakan terjadwal

Tindakan terjadwal secara otomatis menskalakan sumber daya pada tanggal dan waktu tertentu. Mereka bekerja dengan memodifikasi kapasitas minimum dan maksimum untuk target yang dapat diskalakan, dan oleh karena itu dapat digunakan untuk skala masuk dan keluar sesuai jadwal dengan menetapkan kapasitas minimum tinggi atau kapasitas maksimum rendah. Misalnya, Anda dapat menggunakan tindakan terjadwal untuk menskalakan aplikasi yang tidak mengkonsumsi sumber daya pada akhir pekan dengan mengurangi kapasitas pada hari Jumat dan meningkatkan kapasitas pada hari Senin berikutnya.

Anda juga dapat menggunakan tindakan terjadwal untuk mengoptimalkan nilai minimum dan maksimum dari waktu ke waktu untuk beradaptasi dengan situasi di mana lalu lintas yang lebih tinggi dari normal diharapkan, misalnya, kampanye pemasaran atau fluktuasi musiman. Melakukan hal ini dapat membantu Anda meningkatkan kinerja untuk saat-saat ketika Anda perlu skala lebih tinggi untuk peningkatan penggunaan, dan mengurangi biaya pada saat Anda menggunakan lebih sedikit sumber daya.

Pelajari selengkapnya

Layanan AWS yang dapat Anda gunakan dengan Application Auto Scaling— Bagian ini memperkenalkan Anda pada layanan yang dapat Anda skalakan dan membantu Anda mengatur penskalaan otomatis dengan mendaftarkan target yang dapat diskalakan. Ini juga menjelaskan setiap peran terkait layanan IAM yang dibuat Application Auto Scaling untuk mengakses sumber daya dalam layanan target.

Kebijakan penskalaan pelacakan target untuk Application Auto Scaling- Salah satu fitur utama Application Auto Scaling adalah kebijakan penskalaan pelacakan target. Pelajari cara kebijakan pelacakan target secara otomatis menyesuaikan kapasitas yang diinginkan untuk menjaga pemanfaatan pada tingkat konstan berdasarkan metrik dan nilai target yang dikonfigurasi. Misalnya, Anda dapat mengonfigurasi pelacakan target untuk menjaga penggunaan CPU rata-rata untuk Armada Spot Anda sebesar 50 persen. Application Auto Scaling kemudian meluncurkan atau menghentikan instans EC2 sesuai kebutuhan untuk menjaga pemanfaatan CPU agregat di semua server sebesar 50 persen.